<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>LLM-as-a-Judge on GAO AI Blog</title><link>https://gao-blog-7a8ba9.gitlab.io/tags/llm-as-a-judge/</link><description>Recent content in LLM-as-a-Judge on GAO AI Blog</description><generator>Hugo -- gohugo.io</generator><language>ja</language><copyright>© ガオ株式会社 All Rights Reserved.</copyright><lastBuildDate>Thu, 26 Feb 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://gao-blog-7a8ba9.gitlab.io/tags/llm-as-a-judge/index.xml" rel="self" type="application/rss+xml"/><item><title>Langfuse の Observation レベル評価：「どのステップが悪いのか」をスコアで特定できるようになった</title><link>https://gao-blog-7a8ba9.gitlab.io/posts/2026-02-26-langfuse-%E3%81%AE-observation-%E3%83%AC%E3%83%99%E3%83%AB%E8%A9%95%E4%BE%A1-%E3%81%A9%E3%81%AE%E3%82%B9%E3%83%86%E3%83%83%E3%83%97%E3%81%8C%E6%82%AA%E3%81%84%E3%81%AE%E3%81%8B-%E3%82%92%E3%82%B9%E3%82%B3%E3%82%A2%E3%81%A7%E7%89%B9%E5%AE%9A%E3%81%A7%E3%81%8D%E3%82%8B%E3%82%88%E3%81%86%E3%81%AB%E3%81%AA%E3%81%A3%E3%81%9F/</link><pubDate>Thu, 26 Feb 2026 00:00:00 +0000</pubDate><guid>https://gao-blog-7a8ba9.gitlab.io/posts/2026-02-26-langfuse-%E3%81%AE-observation-%E3%83%AC%E3%83%99%E3%83%AB%E8%A9%95%E4%BE%A1-%E3%81%A9%E3%81%AE%E3%82%B9%E3%83%86%E3%83%83%E3%83%97%E3%81%8C%E6%82%AA%E3%81%84%E3%81%AE%E3%81%8B-%E3%82%92%E3%82%B9%E3%82%B3%E3%82%A2%E3%81%A7%E7%89%B9%E5%AE%9A%E3%81%A7%E3%81%8D%E3%82%8B%E3%82%88%E3%81%86%E3%81%AB%E3%81%AA%E3%81%A3%E3%81%9F/</guid><description>&lt;p&gt;こんにちは。ガオ株式会社の黒澤です。&lt;/p&gt;
&lt;p&gt;Langfuse v3.153.0 で [PR &lt;a href="https://www.gao-ai.com/blog/hashtags/11861" target="_blank" rel="noopener noreferrer"&gt;#11861&lt;/a&gt;
](&lt;a href="https://github.com/langfuse/langfuse/pull/11861" target="_blank" rel="noopener noreferrer"&gt;https://github.com/langfuse/langfuse/pull/11861&lt;/a&gt;
) がマージされ、LLM-as-a-Judge を Observation 単位で実行できるようになりました。本記事ではその背景と使い方をまとめます。&lt;/p&gt;</description></item></channel></rss>