チャット
AI と対話する基本画面です。モデルの選択、生成パラメータの調整、ツール呼び出し、ナレッジ(RAG)の利用、API からの呼び出しまでを扱います。
モデルを選ぶ
画面上部の モデル選択 から利用する LLM を選びます。
- Installed Models — すぐ使えるモデル。
- Not Installed(推奨) — 未ダウンロードのモデル。選択するには Ollama 版で
ollama pull <モデル名>が必要です(選択不可表示)。 - ビジョン対応モデル(llava / gemma3 / qwen3-vl など)を選ぶと、画像を添付して解析できます。非対応モデルでは添付画像は OCR で処理されます。
埋め込みモデルは対話用モデルとは別枠で、RAG や添付処理に使われます。
生成パラメータ
上部の Parameters(歯車) から調整します。変更は即時反映され、ポップオーバーを閉じる必要はありません。Reset で既定値に戻ります。
| パラメータ | 範囲 | 既定 | 説明 |
|---|---|---|---|
| Temperature | 0〜1 | 0.7 | 出力のランダム性。0 に近いほど確定的、高いほど多様。 |
| Top P | 0〜1 | 0.9 | 核サンプリング。確率上位 P の語のみから選ぶ。 |
| Top K | 1〜100 | 40 | 上位 K 個の候補のみを考慮。 |
| Repeat Penalty | 1.0〜2.0 | 1.1 | 繰り返しの抑制。1.0 でペナルティなし。 |
| Max Tokens(出力) | 32〜32768 | 8192 | 1 回の生成で出力する最大トークン数。 |
| History Limit | 0〜20 | 10 | 文脈に含める過去メッセージ数(2 で 1 往復)。 |
| Thinking | None / Normal / Thinking | Normal | 思考過程の表示。下記参照。 |
Temperature は実用域 0〜1 で調整してください。コンテキスト長(入力に使える最大量)は管理者がサーバ側(LLM_CONTEXT_LENGTH)で設定します。
思考(reasoning)の表示
Thinking 対応モデル(deepseek-r1 / qwq / gpt-oss など)では、回答前の思考過程を折りたたみ表示できます。Thinking を有効にすると、難しい質問でモデルがより深く推論します。思考の深さは内部で reasoning_effort として Ollama / vLLM / クラウドの各バックエンドに統一的に渡されます。思考に対応しないモデルでは無視されます。
ツール呼び出し
上部の Tools(レンチ) から、モデルが使えるツールを有効化します。対応モデルでのみ表示されます。
| ツール | 内容 |
|---|---|
| データセット | パイプラインで作成した Data Lake のデータセットを参照 |
| フォルダ(マイファイル / 共有) | ファイルを参照。サブフォルダ単位で範囲を絞れる |
| 接続フォルダ | SFTP / S3 / Google Drive などの接続や外部ディレクトリを参照 |
| RAG(社内文書) | ナレッジを検索(search_documents)。Bot 側でツール公開を有効にしたものが対象 |
| Python 分析 | pandas / matplotlib による集計・可視化(コードインタープリタ相当) |
| API 接続 | 登録済みの API コネクタを呼び出す |
ツールの利用可否はモデル(サーバ)側の対応に従います。RAG は、Bot の編集画面で「ツール公開」を有効にしたものだけが候補になります。
ナレッジ(RAG)をチャットで使う
RAGKnowledge からナレッジ(Bot)を選ぶと、その文書を根拠に回答します(複数選択可)。回答には参照元が示されます。
RAGparams で検索の挙動を調整できます。
| パラメータ | 範囲 | 既定 | 説明 |
|---|---|---|---|
| Top K | 1〜10 | 5 | 取得するチャンク数 |
| Min Similarity | 0.1〜0.9 | — | 採用する最小類似度のしきい値 |
| Embedding Model | 埋め込みモデル一覧 | Bot 由来 | 検索とベクトル化に使うモデル(取り込み時と同一が必要) |
| Vision Model | なし(OCR) / VLM | OCR | PDF・画像の解析に使うモデル |
| Vision プロンプト | 自由入力 | 用途別の既定 | 画像解析の指示文 |
チャンクサイズ・重複は、文書を取り込むときに決まります。チャット側からは変更できません(既存ナレッジには影響しません)。
API から使う
DigitalBase は OpenAI 互換の /v1/chat/completions を提供します。チャット画面と同じ機能(クラウド振り分け・画像・OCR・ツール・RAG・思考)を API から利用できます。
curl http://localhost:8000/v1/chat/completions \
-H "Authorization: Bearer sk-..." \
-H "Content-Type: application/json" \
-d '{
"model": "<モデル名 または asst_<アシスタントID>>",
"messages": [
{"role": "system", "content": "あなたは社内アシスタントです"},
{"role": "user", "content": "こんにちは"}
],
"temperature": 0.7,
"stream": true
}'
messagesのsystemロールがシステムプロンプトになります。modelに アシスタント ID(asst_...)を指定すると、そのアシスタントの設定(モデル・温度・ツール・RAG など)が全て適用され、呼び出し側はmessagesだけ送れば動きます。- RAG の参照元は応答の
x_digitalbase.sourcesに含まれます。
認証には API キー(sk-)を使います。発行方法・IP 制限・利用上限はAPI キーを、エンドポイント詳細はOpenAI 互換 APIを参照してください。