2025-12-08から1日間の記事一覧

2025-12-08

評価者としてLLMの判定結果はどこまで信頼できるのか？

Research 生成AI

この記事はRevComm Advent Calendar 2025 8日目の記事です。 qiita.com 1. はじめにこんにちは。Research Engineerの髙瀬です。近年、大規模言語モデル（LLM）の性能向上により、テキスト生成や分類タスク、さらには評価やアノテーションなど、様々な場面…

#生成 AI

RevComm Tech Blog

コミュニケーションを再発明し人が人を想う社会を創る

2025-12-08から1日間の記事一覧

評価者としてLLMの判定結果はどこまで信頼できるのか？