Amazon Novaは、Amazonが開発した最新の基盤モデルで、テキスト、画像、ビデオをプロンプトとして処理することが可能な次世代の生成AIソリューションです。このモデルは、ショッピングガイドから広告、業務効率化ツールまで幅広い用途で利用されており、Amazon Bedrockというフルマネージドサービスを通じて提供されます。Amazon Bedrockを利用することで、顧客は簡単にAmazon Novaモデルや他の基盤モデルを試し、評価し、自身のアプリケーションに最適なモデルを選定することが可能です。
OpenAIのChatGPTやClaudeなどの生成AIと同様のサービスと思っていただければ大丈夫です。
Amazon Novaの特徴とモデルバリエーション
Amazon Novaは以下のモデルを提供しており、それぞれの用途に応じたコストパフォーマンスと機能性を備えています。
Amazon Nova Micro テキスト専用モデルで、非常に低コストで最小の遅延応答を提供。
Amazon Nova Lite 画像、ビデオ、テキストを扱う低コストのマルチモーダルモデル。
Amazon Nova Pro 高精度かつ高速で、さまざまなタスクに最適なマルチモーダルモデル。
Amazon Nova Premier 複雑な推論タスクに対応し、カスタムモデルの教師として使用可能な最も高性能なモデル(2025年第1四半期に利用可能予定)。
Amazon Nova Canvas 最先端の画像生成モデル。
Amazon Nova Reel 画像から動画を生成する最先端のビデオ生成モデル。
Amazon Novaモデルは、コスト、速度、精度のバランスを最適化し、200以上の言語をサポートし、多くのモーダルを扱えるよう設計されています。特に、Amazon Nova Micro、Lite、Proは、それぞれのインテリジェンスクラスでベストパフォーマンスを発揮し、Amazon Bedrock上で最も速く、コスト効率に優れたモデルとして提供されています。
Amazon Novaの性能評価
Amazon Nova Proは、主要なベンチマークにおいて他のトップモデルと競合する性能を示しています。以下は、チャットボットアリーナでの各モデルのパフォーマンスを示す評価項目です。
Language Understanding (MMLU - CoT): 言語理解能力を測定する指標で、Nova Proは85.9%のスコアを示し、ClaudeやGPT-4oには若干劣るものの、GeminiやLLaMaと同等のパフォーマンスを持っています。
General Reasoning (DROP - CoT): 一般的な推論能力を評価する指標で、85.4%のスコアを示しています。Claudeが最高スコアを保持しており、GPT-4oと比較しても競合する性能を持つことがわかります。
Common Sense Reasoning (ARC - c): 常識的な推論能力を測定する項目であり、94.8%のスコアを達成しています。ClaudeとGPT-4oがわずかに高いものの、Nova Proは高い水準を維持しています。
Deep Reasoning (GPQA - Main): 深い推論能力を評価する指標です。46.9%と、他のモデルに比べてやや低めですが、複雑な論理的推論が含まれる領域であるため、他モデルでも課題が残る項目です。
Mathematics (GSM8K): 数学的な問題解決能力を評価します。94.8%と非常に高いスコアを示し、Claudeには劣るものの、他のモデルに比べ優れたパフォーマンスを示しています。
Mathematics (MATH - CoT): 問題解決においてコトリッジ(Chain of Thought)を必要とする数学に関する評価です。76.6%と、Claudeとほぼ同等のスコアを示しています。
Python Code Generation (HumanEval): Pythonコード生成能力を測定し、89.0%という高いパフォーマンスを示します。Claudeには少し劣るものの、他のモデルに対して競争力があります。
Multi-step Reasoning (Big Bench Hard - CoT): 多段階の推論を評価し、86.9%のスコアを示しています。この項目でもClaudeが最も高いスコアを持っていますが、Nova Proも非常に優秀な結果を示しています。
Instruction Following (IFEval): 指示に従う能力を測定する項目です。92.1%という高いスコアを示し、Claudeとほぼ同等であり、他のモデルに対しても優位に立っています。
Translation: EN to 14 languages (Flores200): 英語から14の言語への翻訳能力を測定するもので、43.4%のスコアを示しています。GPT-4oやClaudeと同等の結果を示しており、多言語対応の強化が見られます。
Translation: 14 languages to EN (Flores200): 14の言語から英語への翻訳能力を測定し、44.4%のスコアを示しています。このスコアも他モデルとほぼ同等であり、多言語翻訳において一定の性能を保持しています。
Amazon Novaは、特に標準ベンチマークにおいてGPT-4oなどのトップモデルと競合するパフォーマンスを発揮しています。Claudeには及ばない分野も一部ありますが、多くの評価項目でGeminiやLLaMaと同等またはそれ以上の成果を示しています。これにより、標準的なタスクの多くで十分に高い性能を発揮できることが示されています。
料金体系
Amazon Novaモデルの料金体系は、OpenAIやClaudeと比較して非常に低価格な設定となっています。
ざっくりと、Amazon Nova ProとClaude 3.5 Sonnetを比較するとAmazon Nova Proが4分の1の料金となっています。
同様に、Amazon Nova LiteとClaude 3.5 Haikuを比較するとAmazon Nova Liteの方が13分の1の料金となっています。
1000トークンあたりの入力/出力料金は以下の表の通りです。
入力料金($) | 出力料金($) | |
Amazon Nova Pro | 0.0008 | 0.0032 |
Amazon Nova Lite | 0.00006 | 0.00024 |
Amazon Nova Micro | 0.000035 | 0.00014 |
Claude 3.5 Sonnet | 0.003 | 0.015 |
Claude 3.5 Haiku | 0.0008 | 0.004 |
Nova LiteやNova Microは、低コストでありながら一定の性能を提供するため、小規模なプロジェクトや大量のリクエストが発生するケースにおいて非常に適しています。
この料金体系の筆者の感想
正直に言えば、このAmazon Novaの価格は「破壊的」という言葉がふさわしい。なんとClaudeの4分の1のコストで利用できてしまうのだ。
これを見たとき、私も最初は目を疑った。あまりに低価格すぎるため、利益どころか赤字を覚悟しているのではないかとさえ思ったほどだ。料金表を何度も確認してみたが、やはりその価格設定に間違いはない。
しかし、冷静に考えてみれば、これはAmazonらしい手法だと気づいた。Amazonはかつてから、収益よりも市場シェアを優先する「攻め」の姿勢で知られている。特に思い出したのは、2006年にAWSがサービスを開始した当初、EC2の料金体系を決める際の逸話だ。
ウィレム・ヴァン・ビルヨンというエンジニアがEC2インスタンスの価格を1時間あたり15セントに設定することを提案しました。この価格設定であれば、サービスで収支を均衡させることができると考えていました。 しかし、EC2のローンチ前のSチーム(上級幹部チーム)ミーティングで、ジェフ・ベゾスCEOは一方的にその価格を10セントに引き下げました。 これに対してヴァン・ビルヨンは「そんな価格では長期間赤字になる可能性がありますよ」と指摘しました。 ベゾスの返答は簡潔でした。「素晴らしい(Great)」
このエピソードに象徴されるように、Amazonは利益を削ってでも圧倒的な市場シェアを獲得する戦略を選ぶことがある。その考え方は今も健在なのだろう。Amazon Novaの価格設定を見る限り、この新しいAIサービスもまた同じ哲学に基づいているに違いない。
顧客へのメリットとカスタマイズ機能
Amazon Novaモデルは、カスタマイズをサポートしており、顧客のプロプライエタリデータを用いてモデルを微調整することができます。これにより、テキスト、画像、ビデオなどのデータを使って顧客独自の精度を高めたモデルを生成し、より具体的で関連性の高い応答を提供します。また、知識蒸留技術を用いて、大型モデルの知識を小型で効率的なモデルに移行させることも可能です。
クリエイティブなコンテンツ生成とビデオ理解
Amazon Novaのクリエイティブ生成モデル、Nova CanvasとNova Reelは、広告やビジュアルキャンペーンの作成に活用され、より高品質なコンテンツの生成を実現しています。例えば、Amazon Adsでは、Nova Reelを利用して架空のパスタブランドの広告を制作し、製品をユニークで創造的な形で表現しました。また、Nova Proモデルは、ビデオの理解にも優れており、サイレント映像クリップから詳細なシーン描写を行うことが可能です。
今後の展望と新モデル
2025年には、音声対音声モデルやあらゆるモダリティ(テキスト、画像、音声、ビデオ)の入力・出力が可能な"any-to-any"モデルの導入が予定されています。これにより、モダリティ間の変換や、複数のタスクを1つのモデルで実行できるアプリケーションの開発がさらに簡便化される予定です。
AIboxのご紹介
毎日問い合わせ対応に追われていませんか?AIboxなら、その悩みを解決できます!
RAG(Retrieval-Augmented Generation)技術を活用した高精度な自動応答で、問い合わせを一括管理し、業務効率を劇的に向上。
AIbox導入のメリット
RAG機能で高精度な回答が可能 「AIbox」はRetrieval-Augmented Generation(RAG)という技術を搭載。社内のマニュアルや過去の問い合わせデータ、FAQなどを参照して、内容に基づいた精度の高い回答を提供します。これにより、従来のチャットボットよりも使いやすく、頼れるサポートが実現します。
スムーズな社内コミュニケーション 社内でよく利用されるSlackとの連携機能により、AIboxはSlack内の情報も検索対象にすることが可能です。例えば「経費申請の締め切りを知りたい」といった質問も、Slackから直接AIに問い合わせることで即座に回答を得られ、業務が止まることなく進みます。
徹底サポートと安全性 AIboxは、Azure OpenAIサービスを活用した高いセキュリティ性も特徴です。利用データが外部のOpenAI社に送信されることはなく、企業内の機密文書も安心して取り扱うことができます。さらに、導入時や運用後のデータ整備についても専門スタッフが支援し、スムーズな導入と安心運用が可能です。
こんな部門での活用が進んでいます
経理、総務、人事などのバックオフィス:各部門で必要なFAQやマニュアルをAIboxに登録することで、社員からのよくある問い合わせ対応が自動化され、日常的な業務負担が軽減されます。
カスタマーサポート:エクセルや問い合わせ履歴などのデータをAIに読み込ませておくことで、過去の対応履歴から適切な回答をAIが自動生成。お客様からの問い合わせに、的確で素早い回答を提供できます。
問合せ先
スノーリーズ株式会社について
バックオフィス向けソリューション AIboxについて
Comments