RevComm Tech Blog

コミュニケーションを再発明し 人が人を想う社会を創る

2025-12-08から1日間の記事一覧

評価者としてLLMの判定結果はどこまで信頼できるのか?

この記事はRevComm Advent Calendar 2025 8日目の記事です。 qiita.com 1. はじめに こんにちは。Research Engineerの髙瀬です。 近年、大規模言語モデル(LLM)の性能向上により、テキスト生成や分類タスク、さらには評価やアノテーションなど、様々な場面…