ChatGPTの新機能
この項目でできるようになること
- ChatGPTの新機能について理解する
web検索機能/ChatGPT search
ChatGPTは通常、学習データに基づいた回答を行いますが
web検索機能を使うことでネット上の最新情報に基づいた回答を生成することができます。
有料ユーザー向け(2024年11月現在)にはChatGPT search機能が追加されています。
プロンプト入力画面に新設された[地球儀マーク]をタップしてONにすると、Web情報を含めたチャットAIによる対話が可能になります。
プロンプトに対してウェブ検索から得た内容を情報源として回答を出力してくれます。
これにより学習データにない最新の情報を元にした回答が可能になると共に、情報源が明らかになることで事実検証を行いやすいなどのメリットがあります。
プロンプト例:
今月報道された主な経済ニュースを検索し、まとめてください
※検索するボタンを押下すればプロンプトで指定しなくても内容に応じて検索が行われる場合がありますが、上記の例では明示的にweb検索について指示しています。
注意点:
SearchGPTをONにした場合、モデルはGPT-4oの微調整版となります。
GPT-4o canvasやo1-preview、o1-miniは選択することができません
Suggested replies(部分引用機能)
生成された回答の一部を指定し、その部分への深掘りした質問や修正指示を行うことができます。
使い方:
回答の気になる部分をドラッグして選択
“マークをクリック
テキストウィンドウの上部に引用されたメッセージが表示されることを確認
プロンプトで引用部分への質問や修正依頼を入力
Advanced Data Analytics(データ分析機能)
Advanced Data Analytics機能は、Pythonの実行環境を使って高度なデータ処理を行う機能です。
使い方:
ファイル添付マークをクリック
ファイルのアップロード方法を選択
分析したいファイルを選択し、アップロード
プロンプトで分析依頼を行う
プロンプト例:
添付ファイルは営業成績とKPIに関するCSVデータです
このデータを分析し、ボトルネックを指摘、改善方法を提案してください
Canvas
Canvas機能はChatGPT内に追加された新しいインターフェースです。主に文章作成の支援やソースコード編集の支援を行うために設計されています。従来のユーザーインターフェースに比べてより視覚的な操作が可能で、初心者でも効率的に作業を進められます。
2024年10月時点では有料プラン(Plus, Team, Enterprise, Edu)ユーザーが利用可能です。
Canvas機能の使い方
1.上部メニューからGPT-4o with canvasを選択
2.プロンプトを入力。画面にcanvasウィンドウが表示される
3.canvasウィンドウの右下メニューから各プログラミング機能を選択してコードレビューや修正が可能
プログラミング機能の主な特徴
・コードレビュー: インラインでの改善提案
・デバッグ用のログ追加: 適切な場所にログを自動挿入
・コメント追加: 自動でコメントを挿入
・バグ修正: エラーを検出し自動修正
・言語変換: 複数言語間でコードを自動変換
上記の様にソースコード制作業務に関して様々な支援機能が搭載されており、制作効率が飛躍的に向上しています。
また編集箇所をクリックして直接ソースコードを入力したり、修正箇所をドラッグした上でプロンプトを入力することで該当部分だけを再修正することができます。こうした機能によって繰り返し行う作業やデバッグの効率が大幅に向上します。
また通常の文章校正においても部分的な修正が可能になっています。生成された文章に修正依頼を出す際に、文章全体を再出力する必要がないため作業効率の向上に繋がっています。
高度な音声モード
ChatGPTの「高度な音声モード」は、2024年10月時点で全ての有料プラン(Plus, Team, Enterprise, Edu)ユーザーに正式リリースされた革新的な機能です。この機能により、AIとの会話がより自然で人間に近いものとなりました。スマートフォンアプリケーション及びAPIでの使用も順次解放されています。
※一部の無料プランユーザーにも制限付きで提供されています
主な特徴
- 非常に高速な応答(GPT4の平均回答時間5.4秒に対し、平均0.320秒で回答)
- 笑い声、歌声など複数の感情を含んだ声色の表現
- ユーザーの話すスピードに合わせた応答
- 会話のトーン / 複数の話者 / 背景騒音の認識が可能
使用方法
- アプリで音声アイコンをタップし、音声入力を開始
- 初回使用時は音声設定を選択(後から変更可能)
- 9種類の音声オプションから選択可能
活用方法
1.音声チャットによる使用
通常のチャットを音声化して利用可能です。感情表現を含む直感的なやり取りが可能なほか、返答中の割り込みや訂正にもリアルタイムで対応してくれます。
視覚に制限のあるユーザーでも利用しやすいなど様々な可能性が期待されています。
また、APIを利用すれば外部アプリケーションとの連携も可能です。回答データの設定次第では電話オペレータの様にリアルタイムの音声問い合わせ対応が可能になります。
2.語学学習
日本語>外国語だけでなく、外国語>日本語、外国語>外国語など様々なパターンに対応可能です。
単語や文法チェックに止まらず、発音や聞き取り、会話シミュレーション等にも柔軟に対応してくれます。
3.エンターテインメント
複数の音声が切り替えられる他、チャットと同じ様にキャラクター性や方言を設定すれば設定に従って会話が可能です。
仮想アシスタントやゲームキャラクターなどへの応用の他、映像解析などの機能と組み合わせて実況アナウンスを行うなど様々な可能性が期待されています。
OpenAI o1モデル
2024年9月に発表された新モデル「o1」は、複雑な推論を実行するために強化学習で訓練された新しいAIモデルです。まだ初期段階のモデルながらも、学術分野での難解な課題やコーディング分野において優れた成果を上げており、今後の機能強化によって、さらに多くの実用的なシーンでの活躍が期待されています。
物理学、生物学、化学の問題のベンチマーク (GPQA=Graduate-level Physical and Quantitative Assessment)ダイアモンドレベルの問題集で、人間の博士レベルの精度を超えました。
高性能なOpenAI o1-previewモデル、安価でハイスピードなOpenAI o1-miniモデルの2種類が発表されており、 現在は有料ユーザー(Plus, Team, Enterprise, Edu)から順次利用が解放されています。
OpenAI o1モデルの特徴
数学やコーディング能力においても優れたパフォーマンスを発揮
国際数学オリンピック予選試験で83%のスコア獲得
コーディングコンテスト「Codeforces」で上位11%
初期モデルであり、Web閲覧やファイル・画像のアップロードなどの機能はまだ未対応
複雑な推論タスクでの大きな進歩
OpenAI o1モデルの使い方
1.上部メニューからOpenAI o1-previewもしくはOpenAI o1-miniを選択
2.チャットメニューから従来通りプロンプトを入力
OpenAI o1モデル利用時の注意点
・プロンプトについて
OpenAIの見解によるとo1モデルは従来のGPTシリーズと異なり、「人間が自然に質問するような形で使うのが最適で、複雑な指示や余計な情報は逆効果になる可能性がある」そのため、利用時はよりシンプルで明確なプロンプトが効果的です。
同様に「段階的に考えて」などのステップも不要です。関連情報に絞り、明確な指示を出す事が推奨されています。
・利用制限について
2024年10月現在ではo1モデルの使用制限は下記に設定されています
o1-preview 50メッセージ/週
o1-mini 50メッセージ/1日
通常のGPTモデルに比べるとシビアな回数制限になっています。
・回答時間について
o1モデルは最終的な回答を出す前に、連鎖的な思考で推論を行なっています。多くの計算資源と電力を消費するため、回答にまでに掛かる時間も大幅に増加しています。
・モデルの特性について
o1モデルは従来のモデルに比べて高度な推論や数学に特化している一方、通常の会話機能など得意ではないとされています。
回数制限と合わせて使用タイミングを考慮する必要があります。
DALLE3アップデート
DALLE3はOpenAIが開発した画像生成AIです。
2024年10月時点では無料ユーザーにも1日2枚の制限つきで解放されています。
有料ユーザー(Plus, Team, Enterprise, Edu)には生成数の上限が解放されているほか、生成した画像を部分的に修正する機能も追加されています。
DALLE3の使い方
1.チャットメニューから[〇〇の画像を生成して]の様にプロンプトを入力
2.生成された画像を修正したい場合は上部メニューから[選択する]をクリックし、修正したい部分を塗りつぶして追加プロンプトを入力
効果的なプロンプト作成
詳細な条件を加える
プロンプトに具体的な情報を含めることで、より正確な画像が生成されます。
例:
- 悪い例:「スマホ」
- 良い例:「カメラが2つ搭載された青色のスマホ、背面は光沢のあるガラス素材」
キーポイント
- 色、形状、材質、光の当たり方など、具体的な詳細を追加する
- 画像の雰囲気や様式(例:写実的、漫画風、水彩画風)を指定する
- 背景や環境の説明を含める
効果的な画像修正指示の例
参考画像やスタイルの例を明確に言語化して説明する
- 「右上の建物をより高くしてください」
- 「人物の表情をもっと明るくしてください」
- 「背景の色彩を暖かみのある色調に変更してください」
ショートカット機能
チャット欄から直接ツールにアクセスできるショートカット機能が追加されました。
2024年10月現在、ブラウザ版にのみ解放されています
チャット欄に/を入力すると、「画像を作成」「ウェブを検索」「o1-previewを使用」の3つの選択肢が表示されます。
※ただしo1-previewの使用は新規チャットに限られます。
「画像を生成してください」や「web検索してまとめてください」といった指示をすることなく、これらツールを使用できます。
例:画像生成
/を入力し、「画像を作成」を選択
プロンプトで作成する画像の内容を指定
プロンプト例:
2本脚で走る白い芝犬
例:ウェブ検索
/を入力し、「ウェブを検索」を選択
プロンプトで検索キーワードを入力
プロンプト例:
今日降水確率が50%以上の地域
例:o1-previewモデルの使用
/を入力し、「o1-previewを使用」を選択
プロンプトを入力
プロンプト例:
二重スリット実験が果たした量子力学における意義について構造的にまとめてください
GPT4-oモデルのファインチューニング
20224年8月に「GPT-4o」のファインチューニング機能(独自のデータを追加で学習させ、新たな知識を持つモデルを作り出す技術)が提供開始されました。対象は全ての有料ユーザーです。
独自データでモデルをカスタマイズ可能になり、アプリケーションのパフォーマンスと精度向上が期待されます。例えば企業独自の技術データを追加学習させることで、専門知識をもったChatGPT 4oをカスタマイズすることができます。
主な特徴:
・特定のユースケースに特化したモデルの作成が可能
・一貫した出力フォーマットの実現
・レスポンスの品質向上
・文脈理解の改善
活用できる分野:
- 企業独自の専門知識を持つAIアシスタントの開発
- 特定業界や分野に特化した高精度な回答の実現
- 組織固有の方針やトーンに合わせた一貫性のある応答
- カスタマーサポートの品質向上と効率化
- 社内ナレッジの効果的な活用と共有
Vision Fine-Tuning
さらに現在は画像解析に特化したVision Fine-Tuning機能も解放されています。こちらは画像認識・理解能力を特定の用途に最適化するための技術です。
これにより開発者は、より強力な画像理解機能を持つようにモデルをカスタマイズできます。
特定の分野の画像を学習データとして利用することにより、より高度で実用的な画像認識ソリューションの開発を可能にします。様々な産業での革新的な応用が期待されています。
活用できる分野:
- 医療画像の専門的な診断支援
- 産業用の品質検査や異常検知
- 特定商品の詳細な識別と説明
- セキュリティシステムでの特定パターンの検出
- 建築・土木での構造物の分析
このようにファインチューニングは組織や目的に応じてAIを最適化し、より実践的な応用を可能にします。今後、様々な分野でカスタマイズされた生成AIの活用が期待されています。
※利用条件、具体的な実装方法やモデルの種類は頻繁にアップデートされるため、最新の情報は、OpenAIの公式ドキュメントで確認することを推奨します。
プロンプトキャッシング
こちらはChatGPT API向けの機能です(2024年11月時点)
繰り返しのあるプロンプトの一部をサーバーに保存し、APIリクエストを再利用します。ゼロからプロンプトを処理するよりも安価かつ迅速に処理することができます。これにより、長いプロンプトでは反応遅延を最大80%、コストを50%削減できます。
プロンプトキャッシュは、すべてのAPIリクエストに対して自動的に機能し(コードの変更は不要)、追加料金は発生しません。
対象モデル:
・gpt-4o
・gpt-4o-mini
・o1-preview
・o1-mini
まとめ
プロンプトは、AIと対話するための重要な手段であり、その質によってAIの出力結果が大きく変わります。プロンプトエンジニアリングは、AIを使いこなす上で必須のスキルであり、効果的なプロンプトを作成するための様々なテクニックが存在します。
この章で学んだ基本的な概念を踏まえ、プロンプトエンジニアリングのスキルをさらに磨いていきましょう。