変化し続けるテクノロジーの世界で、イーロン・マスクの取り組みが波紋を広げないことはほとんどない。GPT-4よりも有能なLLMの育成をやめるよう呼びかけてから数週間後、マスクは彼らしい行動をとった。マスクの最新の発明であるxAIと、土曜日に発表された新しいLLMであるGrokの登場だ。
Grokの発表!
Grokは『銀河ヒッチハイク・ガイド』をモデルにした人工知能で、どんな質問にも答えることができ、さらにどのような質問をすればよいかを提案することもできる!
Grokはユーモアを交えて質問に答えるように設計されており、反抗的な一面もあるので、使用しないでください…
– xAI (@xai) 2023年11月5日
このプロジェクトはマスクの関与だけでなく、同社が新興企業やハイテク大手から優秀なAI研究者を集めたことでも話題になった。xAIは、「世界を理解する」ことができる人工知能という魅力的な見通しとともに推進されたが、「どのように」「何を」運営するかについては秘密主義を貫いた。少なくとも先週までは。
これも現状に挑戦するマスクの古典的な動きなのだろうか、それとも前任者たちを取り囲んだ人気と誇大広告の大波に乗った、過剰に宣伝されたチャットボットなのだろうか?
ザ・グッド
リアルタイムの絶え間ない知識の流れ
Twitterの全コンテンツストリームへのアクセスは、Grokをゲームチェンジャーにする可能性がある。xAIが指摘するように、GrokはAI研究者が人間のフィードバック強化学習(RLHF)と呼ぶ「リアルタイム世界知識」を持ち、時事ニュースや様々なコメントを処理する。
様々な角度から出来事について学び、ツイッター・コミュニティ(基本的にコメントで構成されている)からメモを取ることで、Grokは世界についての多層的な見方から恩恵を受けるだろう。
最近の研究によると、人々はすでに、従来のメディアに目を向ける前に、ソーシャルメディアでニュースを検索するように行動を変えている。GrokのTwitterとの統合は、このプロセスをさらに加速させ、ユーザーに即座にコメントや文脈を提供し、うまくすればその場で事実確認を行うことができる。xAIが指摘したように、リアルタイムの知識機能により、Grokは常に世界の動きを把握し、タイムリーで適切な回答を提供することができる
。
ファンモード:イーロンの夢が実現
イーロン・マスクのビジョンである「楽しいことが大好きな人工知能」は、Grokのいわゆる「ファンモード」によって実現したようだ。この機能により、LLMはジョークを言ったり、気の利いた、しかし正しい回答をしたり、ユーザーに楽しくカジュアルな会話体験を提供することができる。
ChatGPTのような既存のLLMがもたらす課題のひとつは、政治的な正しさを確保するために過剰にこすりつけられたと感じるユーザーがいることで、その結果、交流が有機的で自発的なものでなくなる可能性がある。さらに、ローカライズされたLLMの中には、長時間のインタラクションに適さないものもある。Grokは、その楽しいモードでこのギャップを埋め、リラックスしたい人のための魅力的な娯楽として機能することを約束する。
Grokは、ᵔプラットフォームを通じてリアルタイムの情報にアクセスできる。
彼はまた、&を頼りにしている。♂️ pic.twitter.com/e5OwuGvZ3Z
– Elon Musk (@elonmusk) November 4, 2023
このコンセプトはまったく新しいものではない。QuoraのPoeは、きめ細かく調整されたチャットボットで同様のサービスを提供しており、それぞれのチャットボットは独自の個性をもっている。しかし、Grokの機能をLLMに組み込むことで、その体験は新たなレベルに到達する。
ネイティブインターネットアクセス
Grokの他の差別化要因の1つは、プラグインや他のモジュールを必要とせずにインターネットにアクセスできることです。
ブラウジング機能の正確な範囲はまだ決まっていないが、このアイデアは魅力的だ。リアルタイムでデータを相互参照する機能によって、事実の正確性を向上させることができるLLMを想像してみてほしい。GrokはTwitterのコンテンツへのアクセスと合わせて、ユーザーのAIとの関わり方に革命をもたらすかもしれない。ユーザーが受け取る情報は、既存の学習データに基づくだけでなく、常に更新され検証されていることを知ることができるからだ。
マルチタスク
Grokはマルチタスクに対応しており、ユーザーは同時に複数の会話をすることができると言われている。ユーザーは異なるトピックを探索し、あるスレッドで返答を待ち、別のスレッドで続けることができる。
このチャットボットには会話を分岐させる機能もあり、ユーザーはメインのディスカッションを中断することなく特定の分野を掘り下げることができる。
Grokはまた、統合されたMarkdownエディタも提供しており、ユーザーはGrokの回答をダウンロード、編集、フォーマットして後で使用することができます。このツールとブランチ機能を組み合わせることで、ユーザーは特定の会話ブランチで作業し、シームレスにバックトラックすることができます。
Grokのユーザーインターフェースには、このような特徴があります。まず、マルチタスクが可能です。複数の会話を同時に行い、切り替えながら進めることができる。pic.twitter.com/aXAG0M2oPF
– Toby Pohlen (@TobyPhln) 2023年11月5日
最小限の検閲:自由に話すAI
イーロン・マスクのGrokビジョンは明確だった。
すべての主要なAIチャットボットには、潜在的な危害や誤報を避けるための保護機能が備わっているが、これは時として制限になることがある。ChatGPT、Llama、Claudeのようなモデルは、潜在的な不快感を避けるために応答を控えていることにユーザーは気づいている。しかし、これは無害な回答や本当に望ましい回答を除外してしまう可能性がある。
Grokは応答がより自由であるため、より本格的で自由な会話体験を提供することができる。xAIが指摘するように、Grokはそのデザインにより、他のAIシステムが無視するような意味のある質問にも答えることができる
。
Grokの発表!
Grokは銀河ヒッチハイクガイド風のAIで、ほとんど何でも答えることができ、さらに難しいことに、どのような質問をすべきかを提案することができる!
Grokはユーモアを交えて質問に答えるように設計されており、反抗的な一面もあるので、使用しないでください…
– xAI (@xai) 2023年11月5日
このAIが、リアルタイムの情報、ユーモア、正確さ、そして自由というユニークな融合を提供することは明らかだ。しかし、あらゆるイノベーションと同様に、考慮すべき課題と潜在的な落とし穴がある。
悪
急速な発展と限られたトレーニング
グロックの急速な成長は、当初からいくつかの懸念を引き起こしていた。xAIが説明したように、「Grokはまだ非常に初期のベータ版製品で、2ヶ月のトレーニングで精一杯でした」。LLMの世界では、2ヶ月と330億のパラメータは大海の一滴に思える。
それに比べ、OpenAIは「GPT-4の微調整に6カ月を費やした」と、開発プロセスについて透明性を保っている。この開発期間の違いは、Grokの開発がAIの波に乗るために急がされたことを示唆している。
さらに、x.AIはGrokの訓練に使用したハードウェアの範囲について沈黙しており、推測の余地を残している。
パラメータのすべて
初心者の方のために簡単に説明すると、LLMパラメータはモデルが記憶できる情報や知識の量を表しています。これは人工知能の実際の脳の容量を示し、情報を処理し生成する能力を決定する。330億ものパラメータを持つGrokは、一見すると印象的に見えるかもしれない。
しかし、LLMの競争環境においては、Grokは単なるプレーヤーに過ぎない。実際、ChatGPT、Claude、Bardのような大企業がゴールド・スタンダードとして設定しているような複雑なビジネス要件を満たし、高品質の結果を提供するには、パラメーターの数は十分ではないかもしれない。
HumanEvalやMMLU:
のような主要なベンチマークでGrokが他の主流モデルを打ち負かすことができないのは、このパラメータ数の少なさによるところもあります。

Source: x.AI
パラメータの数に加え、コンテキストをどう扱うか、つまりAIチャットボットが入力からどれだけの情報を理解できるかという問題もある。Grokはこの分野では特に印象的ではない。xAIによると、Grokは8,192個のコンテキスト・トークンを含むが、GPT-4は32,000個、Claudeはさらに100,000個のコンテキスト・トークンを扱う。OpenAIの新しいGPT-4 Turboは128,000トークンのコンテキストウィンドウに達する
。
イノベーションの代償
コストはあらゆる製品の価値を評価する上で極めて重要な要素であり、Grokも例外ではない。このチャットボットは、月々16ドルを支払うことで利用できるようになる。
GPT-3.5ターボをベースとするClaude 2やChatGPTのような無料の提供物を考えると、Grokは厳しいかもしれない。特に、これらの無料モデルはその精度が高く評価されており、いくつかのベンチマークではすでにGrokを上回っていることを考えると。
さらに、最も強力なLLMであるGPT-4でさえ、広くアクセス可能で、マルチモーダルかつ強力であるという利点があり、Grokよりも優れていることが約束されている。
@xAI Grok AIアシスタントはᵔ Premium+の一部として提供されているので、サインアップすることをお勧めする。
インターネット経由で月額わずか16ドル。https://t.co/wEEIZNjEkp
– イーロン・マスク (@elonmusk) 2023年11月4日
Grokの導入は、主にツイッターブルーの購読者を増やし、ツイッターの収入源を拡大するための戦略的な動きなのだろうか?
これらの懸念は、グロークがLLMの分野で主要なプレーヤーとしての地位を確立することがいかに難しいかを浮き彫りにしている。また、デメリットは価格だけにとどまらない。
醜い
フィクションの省略
人気小説の架空の人物をLLMのモデルにすることは、間違いなく創造的な決断である。架空の人物の魅力は魅力的かもしれないが、正確な情報への依存度が高まる世界ではリスクが伴う。深刻な質問やアドバイスを人工知能に求めるユーザーは、コミックのキャラクターを模倣したシステムに引っかかるかもしれない。
フィクションと現実の境界線がますます曖昧になるにつれ、ユーザーが冗談や風刺的な回答を本当の情報だと誤解するリスクもある。あらゆる情報が分析され、共有されるデジタル時代において、そのような誤解がもたらす結果は広範囲に及ぶ可能性がある。特に、複数の言語が登場する場合はなおさらだ。
ユーモアやウィットにはそれなりの役割があるが、特にユーザーが批判的な洞察を求めている場合には、バランスを取ることが重要である。正確さよりもユーモアを優先させることは楽しいかもしれないが、LLMが提供すべきものの本質、つまり信頼できる情報を損なうことにもなる。
過剰な約束と過小な提供
イーロン・マスクのGrokに関する大きな約束は、大きな期待を抱かせるものだった。よく見ると、誇大広告と現実の間に潜在的な矛盾があることがわかる。従来のLLMのトレーニング方法がトレーニングデータによって制限されているという事実は、根本的な限界を浮き彫りにしている。
Grokのトレーニングは、330億のパラメーターとわずか数ヶ月の開発期間で、他のLLMの巨人と比べると取るに足らないものに見える。遊び心のある架空の人格というアイデアは魅力的に聞こえるが、標準的なトレーニング方法で革命的な結果を出せるという期待は、少し誇張されているのかもしれない。
AIコミュニティは誇張表現に慣れているが、この分野の急速な進歩を考えると、ユーザーは幻想を超えて見る方法を知っていることが重要である。スーパーAI」の地位を獲得することは困難な挑戦であり、Grokが現在の構成とトレーニングでそれを達成できるとは考えにくい。
Grokの能力を実証するために、イーロン・マスクは彼のチャットボットをプログラミングの訓練を受けた小さなLLMと比較した。フェアな戦いではなかったことは言うまでもない。
イーロン・マスク (@elonmusk) 2023年11月5日
Grok vs 典型的なGPTの例。Grokは本当の情報を持っているが、もう一方は持っていない。
偽情報の脅威
LLMは強力だが、無謬ではない。厳密な基準がなければ、事実と虚構を見分けるのは至難の業となる。最近の歴史は、4chanのデータに基づいて訓練されたチャットボットや、Twitter上で対話することを許可された初期のマイクロソフトのチャットボットであるTayのような、冷ややかな例を提供している。これらのボットはヘイトスピーチを広めただけでなく、説得力を持って実在の人物になりすまし、多くのオンライン視聴者を欺いた。
今週、攻撃的で差別的な文章を作成する@huggingfaceモデルがAIで公開され、すでに3万件以上の下劣なコメントをオンラインに投稿した(作者談)。
この実験は、AIの人体研究委員会を通過することはないだろう。以下は私の提案である。
1/7 https://t.co/tJCegPcFan pic.twitter.com/Mj7WEy2qHl
– Lauren Oakden-Rayner ️⚧️ (@DrLaurenOR) 6 June 2022
この偽情報への浮気は孤立したケースではない。イーロンの就任以来、ツイッターのイメージは悪化しており、グロックが一貫して正確な情報を提供する能力に疑問が持たれているのかもしれない。文系出身者は時に幻覚の犠牲者となり、こうした歪曲が真実と受け取られた場合、その影響は憂慮すべきものとなる。
誤情報の可能性は時限爆弾だ。ユーザーがますます人工知能に情報を依存するようになると、誤った情報が誤った決断につながる可能性がある。信頼される味方になるためには、グロックは慎重に行動し、彼の遊び心が真実を覆い隠さないようにしなければならない。
マルチモーダル機能の欠如?
急成長する人工知能の世界では、Grokのテキストのみのアプローチは過去の遺物のようだ。ユーザーはGrokのサービスにお金を払わなければならないが、他のLLMがよりリッチでマルチモーダルな体験を提供しているのに、なぜと思うのは当然だろう。
例えば、GPT-4-vはすでにマルチモーダリティで大きな進歩を遂げており、聞いたり、見たり、話したりすることができる。グーグルの次期ジェミニも同様の機能を約束している。このような状況において、Grokの提案はかなり物足りなく見え、彼らの価値提案にさらなる疑念を抱かせる。
市場は競争が激しく、ユーザーの要求も高まっている。Grokがニッチを開拓したいのであれば、真に卓越したものを提供しなければならない。競合他社が高度な機能とより優れた精度を、しばしば無料で提供していることを考えると、Grokはそのための仕事をしなければならない。
結論
Grokのローンチは熱狂を呼び起こしたが、懐疑的な見方もあった。MVP(Minimum Viable Product)アプローチは、ユーザーからのフィードバックに基づく迅速な反復と改善を可能にする。しかし、自由に使えるリソースがはるかに多い人工知能大手との競争は厳しい。
成功するためには、Grokは新しく有用な機能を提供しなければならない。混雑した市場では、純粋なエンターテインメント価値だけでは十分ではないだろう。人工知能の人々は、かわいい犬のミームには気を取られないだろう。
結局のところ、Grokの運命は革新性と実用性のバランスにかかっている。健全な懐疑論は正当化されるが、同社を完全に見限るのは時期尚早だろう。Grokはまだ新境地を開く可能性もあるし、AIの発展における脚注に終わる可能性もある。いずれにせよ、その型破りな出自は、Grokが人工知能の歴史の中で魅力的な章を刻むことを保証している
。