Honeybadger
最終更新
Honeybadger は、主にアプリケーションで発生したエラーの記録・観測、エラーによるアラートの発火のために利用しているエラートラッキングサービスです。
Honeybadger にエラーを送信する仕組みは servicex で実現されています。
「観測したい事象に対してどのツールを使えばよいか」については トラブルシューティング を参照してください。
トップページに行くと、Honeybadger でエラーをトラッキングしているプロジェクト (アプリケーション) が一覧になっているので、観測したいものを選択します。

プロジェクトを選択すると、以下のようなプロジェクト内で起こったエラー一覧が表示される画面に遷移します。ここでは同じ内容のエラーがグルーピングされて表示されるようになっており、今までに起こった回数や 1 時間以内に起こった回数などをざっくり把握できます。
この画面でよく見るのは 1 時間以内に大量にエラーが出ているかどうか です。もし大量に出ているエラーがあれば、それを選択して詳細画面へ進みます。

各エラーの詳細画面は以下のようになっています。例えばある特定の時刻からエラーが急増していることを発見し、その時刻付近に起こったイベント (e.g. デプロイ、DB の障害) を紐付けて仮説を立てていく ことをよくやります。

具体的にコード上のどこでエラーが発生したのかはバックトレースで確認します。

他のマイクロサービスからのリクエストでエラーが発生した場合、その API がどのような使われ方をしているか分かりにくく、Honeybadger だけを見てもユーザー影響の判断やデバッグが難しいことがあります。
そのような場合は、「Context」欄の中の datadogTraceUrl から、そのエラーが発生したリクエストが含まれる Datadog Trace ページを開くと、そのエラーがリクエスト全体のどの部分で発生したのか、ユーザーがどのようなリクエストをしたときに発生したエラーなのかを確認できます。
この datadogTraceUrl は servicex によって追加されています (実装 (internal))。


Datadog Trace の見方については Datadog を参照してください。
最終更新