top of page
AIbox magazin
スノーリーズ株式会社(Snowlys inc.)が運営するAI情報発信メディア

AIの未来をリードする—メルマガ登録で最新情報をゲット!

AIの未来をリードする
メルマガ登録で最新情報をゲット!

AIの最新トレンドや活用事例、業界の動向を配信します。
・2週間に1回配信します
・メルマガの購読はワンクリックで解除できます
・メールアドレスが第三者に共有されることはありません

ChatGPT「o3」の登場でAGI完成まであとわずかか

最近のAI開発にとって、ターニングポイントとなる発表が行われました。OpenAIの新しいAIモデル「o3」が、人工知能の能力テスト「ARC-AGI」で驚異的なスコア「87.5%」を達成したのです。これは単なる数字の向上ではなく、AIの知能が本質的に進化したことを示す重要な転換点です。


ついに来た!AIの革新的な瞬間

o3の達成により、これまでの道のりを振り返ってみましょう。

  • GPT-3 (2020年):0%

  • GPT-4o (2024年):5%

  • O1-preview (2024年):21%

  • O1 Pro (2024年):~50%

  • o3 tuned high (2024年):87%

ChatGPT「o3」のARC-AGIのベンチマークテスト
ChatGPT「o3」のARC-AGIのベンチマークテスト

たった年数でここまでの進展を遂げたことは、AIの世界でも前例のない事例です。


ARC-AGIとは?

ARC-AGIは、Alignment Research Center Artificial General Intelligenceの略称で、AIの能力を評価するためのベンチマークとテストスイートを提供します。これは、特に泛用人工知能の進展を測定するために設計されました。


ARC-AGIの目的

  • AGIの進展測定:AIが泛用性を要するタスクをどれだけ効率的にこなせるかを評価。

  • 安全性の検証:高度なAIが意図しない行動をとらないよう設計されているかの検証。


ARC-AGIの特徴

  1. 多様な課題の評価

    • プログラミング、論理的推論、言語理解など、泛用性を要するタスクを輸入。

    • AIがタスクを完遂する能力と適幹力を測定。

  2. 人間の能力との比較

    • テスト結果を人間の基準と比較し、モデルの性能を評価。

  3. 安全性評価の組み込み

    • モデルが予期しない危険な行動をとらないか確認。


ARC-AGIの意義

  • 技術的マイルストーンの設定:テストスコアを用いてAI開発の進展を数値化、各モデルの進化を比較可能に。

  • 研究者や企業へのフィードバック:テスト結果を通じて、AIモデルがどの程度AGIに近づいているか、課題がどこにあるかを明らかに。


なぜこれが重要なのか?

o3までの成果を振り返ると驚異的に成長していることがわかります。

  • 当初、GPT-4 (2023年)はわずか2%のスコアに過ぎなかった。

  • GPT-4oは試行錯誤の結果、5%まで向上。

  • O1シリーズでは50%を突破。

  • o3では、76%(低設定)から70%を超え、最終的87.5%(高設定)に達した。

これはただの数字の増加ではありません。これまで何年も困難を知られた問題が、AIによりいっ気に解決されつつあることを意味しています。


ただし、課題もある

これだけのパフォーマンスを達成するためには、巨大な計算資源が必要です:

  • 高設定は低設定の172倍の計算パワーを使用

  • たとえ低設定でも、目標とされる効率的な実装の100–1000倍の資源を消費しています。

これにより、実用化にはまだ時間がかかりそうですが、それでも大きな前進です。


今後の展開

ARCプロジェクトは、V2, V3と次のステップに向けて動き出しています:


V2とは?

  1. 効率的な実装を目指す 現在のo3モデルでは、パフォーマンスを発揮するために膨大な計算資源が必要です。V2は、このリソース消費を大幅に削減し、より効率的に動作することを目指しています。

  2. スケーラビリティの向上 V2では、AIモデルが多様な環境で適応可能であり、大規模システムでも柔軟に展開できる設計が予定されています。

  3. 実用化へのステップ 研究段階から実際のユースケースでの活用を目指し、現在の課題である計算負荷やコストを低減しつつ、高い精度を維持することが期待されています。


V3とは?

V3は、V2で得られた成果を基にさらに進化した次世代のAI実装計画です。以下の特徴が期待されています:

  1. 高度な適応性

    • 多様なタスクや状況において、人間に匹敵する柔軟性を発揮する能力を目指します。

  2. 倫理的AIの追求

    • AGIが人間の価値観に沿った形で行動するよう、より高度な安全性と倫理基準を組み込む。

  3. 大規模デプロイの可能性

    • 産業や社会における多様な応用分野での使用が現実的に。


AIboxのご紹介 – 問い合わせ業務効率化の新時代へ

AIboxは問い合わせ業務を効率化し、社員がより創造的な仕事に集中できる環境を提供します。

AIbox
AIbox

AIbox導入のメリット

  1. RAG機能で高精度な回答が可能 「AIbox」はRetrieval-Augmented Generation(RAG)という技術を搭載。社内のマニュアルや過去の問い合わせデータ、FAQなどを参照して、内容に基づいた精度の高い回答を提供します。これにより、従来のチャットボットよりも使いやすく、頼れるサポートが実現します。

  2. スムーズな社内コミュニケーション 社内でよく利用されるSlackとの連携機能により、AIboxはSlack内の情報も検索対象にすることが可能です。例えば「経費申請の締め切りを知りたい」といった質問も、Slackから直接AIに問い合わせることで即座に回答を得られ、業務が止まることなく進みます。

  3. 徹底サポートと安全性 AIboxは、Azure OpenAIサービスを活用した高いセキュリティ性も特徴です。利用データが外部のOpenAI社に送信されることはなく、企業内の機密文書も安心して取り扱うことができます。さらに、導入時や運用後のデータ整備についても専門スタッフが支援し、スムーズな導入と安心運用が可能です。


こんな部門での活用が進んでいます

  • 経理、総務、人事などのバックオフィス:各部門で必要なFAQやマニュアルをAIboxに登録することで、社員からのよくある問い合わせ対応が自動化され、日常的な業務負担が軽減されます。

  • カスタマーサポート:エクセルや問い合わせ履歴などのデータをAIに読み込ませておくことで、過去の対応履歴から適切な回答をAIが自動生成。お客様からの問い合わせに、的確で素早い回答を提供できます。


スノーリーズ株式会社について


バックオフィス向けソリューション AIboxについて、お問合せはこちら

Comments


b367c377-a8c4-411a-a21e-e5d603bcd498 (1).jpg

スノーリーズ株式会社​

代表取締役

石黒翔也

​執筆者プロフィール

約7年間にわたりモバイルアプリケーションやWebアプリケーションの開発、AzureやAWSを活用したサーバー構築に従事。

その後、2021年にスノーリーズ株式会社を設立し、AIで問い合わせ業務の効率化を実現する「AIbox」を開発。

AIboxは最新のRAG技術(Retrieval-Augmented Generation)を活用し、問い合わせ業務に課題を抱える企業に採用されています。

現在は、企業の技術顧問としても活動しながら、AIやクラウド技術の普及に取り組んでいます。

bottom of page