思考モード
シナリオに応じて複数の思考モードを提供し、タスクに合わせて推論の深さを適応させます。
ビジョン理解
画像、動画、ファイルに対する強力な視覚理解をサポートします。
ストリーミング出力
リアルタイムのストリーミング応答を提供し、ユーザーインタラクション体験を向上させます。
関数呼び出し
強力なツール呼び出し機能を有効にし、さまざまな外部ツールセットとの統合を実現します。
コンテキストキャッシュ
インテリジェントなキャッシュメカニズムを使用して、長い会話でのパフォーマンスを最適化します。
長いコンテキストウィンドウ
200Kのコンテキスト長をサポートし、モデルが広範な会話や大規模なコードベースを処理できるようにします。
最大出力トークン
1回の応答で最大128Kトークンを生成できます。
マルチモーダル入力
動画、画像、テキスト、ファイル入力をネイティブに受け入れます。
Zhipu AIのGLM-5V Turboは、複雑な画像分析、視覚的推論、視覚入力からのテキスト生成向けのマルチモーダル視覚言語モデルです。
分類:チャットボット
アクセスリンク:https://docs.z.ai/guides/vlm/glm-5v-turbo
タグ:マルチモーダルAI、視覚言語モデル、画像分析、視覚推論、智譜AI