チャット

AI と対話する基本画面です。モデルの選択、生成パラメータの調整、ツール呼び出し、ナレッジ(RAG)の利用、API からの呼び出しまでを扱います。

モデルを選ぶ

画面上部の モデル選択 から利用する LLM を選びます。

Installed Models — すぐ使えるモデル。
Not Installed（推奨） — 未ダウンロードのモデル。選択するには Ollama 版で ollama pull <モデル名> が必要です（選択不可表示）。
ビジョン対応モデル（llava / gemma3 / qwen3-vl など）を選ぶと、画像を添付して解析できます。非対応モデルでは添付画像は OCR で処理されます。

埋め込みモデルは対話用モデルとは別枠で、RAG や添付処理に使われます。

生成パラメータ

上部の Parameters（歯車） から調整します。変更は即時反映され、ポップオーバーを閉じる必要はありません。Reset で既定値に戻ります。

パラメータ	範囲	既定	説明
Temperature	0〜1	0.7	出力のランダム性。0 に近いほど確定的、高いほど多様。
Top P	0〜1	0.9	核サンプリング。確率上位 P の語のみから選ぶ。
Top K	1〜100	40	上位 K 個の候補のみを考慮。
Repeat Penalty	1.0〜2.0	1.1	繰り返しの抑制。1.0 でペナルティなし。
Max Tokens（出力）	32〜32768	8192	1 回の生成で出力する最大トークン数。
History Limit	0〜20	10	文脈に含める過去メッセージ数（2 で 1 往復）。
Thinking	None / Normal / Thinking	Normal	思考過程の表示。下記参照。

補足

Temperature は実用域 0〜1 で調整してください。コンテキスト長（入力に使える最大量）は管理者がサーバ側（LLM_CONTEXT_LENGTH）で設定します。

思考(reasoning)の表示

Thinking 対応モデル（deepseek-r1 / qwq / gpt-oss など）では、回答前の思考過程を折りたたみ表示できます。Thinking を有効にすると、難しい質問でモデルがより深く推論します。思考の深さは内部で reasoning_effort として Ollama / vLLM / クラウドの各バックエンドに統一的に渡されます。思考に対応しないモデルでは無視されます。

ツール呼び出し

上部の Tools（レンチ） から、モデルが使えるツールを有効化します。対応モデルでのみ表示されます。

ツール	内容
データセット	パイプラインで作成した Data Lake のデータセットを参照
フォルダ（マイファイル / 共有）	ファイルを参照。サブフォルダ単位で範囲を絞れる
接続フォルダ	SFTP / S3 / Google Drive などの接続や外部ディレクトリを参照
RAG（社内文書）	ナレッジを検索（`search_documents`）。Bot 側でツール公開を有効にしたものが対象
Python 分析	pandas / matplotlib による集計・可視化（コードインタープリタ相当）
API 接続	登録済みの API コネクタを呼び出す

補足

ツールの利用可否はモデル(サーバ)側の対応に従います。RAG は、Bot の編集画面で「ツール公開」を有効にしたものだけが候補になります。

ナレッジ(RAG)をチャットで使う

RAGKnowledge からナレッジ(Bot)を選ぶと、その文書を根拠に回答します（複数選択可）。回答には参照元が示されます。

RAGparams で検索の挙動を調整できます。

パラメータ	範囲	既定	説明
Top K	1〜10	5	取得するチャンク数
Min Similarity	0.1〜0.9	—	採用する最小類似度のしきい値
Embedding Model	埋め込みモデル一覧	Bot 由来	検索とベクトル化に使うモデル（取り込み時と同一が必要）
Vision Model	なし(OCR) / VLM	OCR	PDF・画像の解析に使うモデル
Vision プロンプト	自由入力	用途別の既定	画像解析の指示文

補足

チャンクサイズ・重複は、文書を取り込むときに決まります。チャット側からは変更できません（既存ナレッジには影響しません）。

API から使う

DigitalBase は OpenAI 互換の /v1/chat/completions を提供します。チャット画面と同じ機能（クラウド振り分け・画像・OCR・ツール・RAG・思考）を API から利用できます。

curl http://localhost:8000/v1/chat/completions \
  -H "Authorization: Bearer sk-..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "<モデル名 または asst_<アシスタントID>>",
    "messages": [
      {"role": "system", "content": "あなたは社内アシスタントです"},
      {"role": "user", "content": "こんにちは"}
    ],
    "temperature": 0.7,
    "stream": true
  }'

messages の system ロールがシステムプロンプトになります。
model に アシスタント ID（asst_...）を指定すると、そのアシスタントの設定（モデル・温度・ツール・RAG など）が全て適用され、呼び出し側は messages だけ送れば動きます。
RAG の参照元は応答の x_digitalbase.sources に含まれます。

認証には API キー（sk-）を使います。発行方法・IP 制限・利用上限はAPI キーを、エンドポイント詳細はOpenAI 互換 APIを参照してください。