Skip to content
Merged
Show file tree
Hide file tree
Changes from all commits
Commits
File filter

Filter by extension

Filter by extension

Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
12 changes: 6 additions & 6 deletions ja/use-dify/getting-started/quick-start.mdx
Original file line number Diff line number Diff line change
Expand Up @@ -230,21 +230,21 @@ description: "サンプルアプリを通じてDifyを深く理解"

2. **フィルタ条件**を有効にします:`{x}type` **に** `Doc`。

### 5. ドキュメントからテキストを抽出:ドキュメント抽出器ノード
### 5. ドキュメントからテキストを抽出:テキスト抽出ノード

<Info>
`gpt-5.2`はPDFやDOCXなどのアップロードされたドキュメントを直接読むことはできないため、まずプレーンテキストに変換する必要があります。

これがまさにドキュメント抽出器ノードが行うことです。ドキュメントファイルを入力として受け取り、次のステップのためにクリーンで使用可能なテキストを出力します。
これがまさにテキスト抽出ノードが行うことです。ドキュメントファイルを入力として受け取り、次のステップのためにクリーンで使用可能なテキストを出力します。
</Info>

<Frame>
![ドキュメント抽出器](/images/use-dify/get-started/deeper-dive-doc-extractor.png)
![テキスト抽出ノード](/images/use-dify/get-started/deeper-dive-doc-extractor.png)
</Frame>

1. ドキュメントノードの後に、ドキュメント抽出器ノードを追加します
1. ドキュメントノードの後に、テキスト抽出ノードを追加します

2. ドキュメント抽出器ノードのパネルで、`Document/result`を入力変数として設定します。
2. テキスト抽出ノードのパネルで、`Document/result`を入力変数として設定します。

### 6. すべての参考資料を統合:LLMノード

Expand All @@ -258,7 +258,7 @@ description: "サンプルアプリを通じてDifyを深く理解"
![情報統合](/images/use-dify/get-started/deeper-dive-info-integrate.png)
</Frame>

1. ドキュメント抽出器ノードの後に、LLMノードを追加します。
1. テキスト抽出ノードの後に、LLMノードを追加します。

2. 画像ノードもこのLLMノードに接続します。

Expand Down
Original file line number Diff line number Diff line change
Expand Up @@ -211,7 +211,7 @@ Google Drive、Dropbox、OneDriveなどのクラウドストレージサービ

PDF、XLSX、DOCXなど多様な形式のドキュメントが存在しますが、LLMはこれらをそのまま扱えません。そのため、抽出器(Extractor)が各種ファイルを解析・変換し、LLMが扱いやすい形式に変換します。

Difyのドキュメント抽出器、あるいはMarketplaceから「Dify Extractor」「Unstructured」等のツールを選択できます。
Difyのテキスト抽出ノード、あるいはMarketplaceから「Dify Extractor」「Unstructured」等のツールを選択できます。

<Accordion title="ドキュメント内の画像">

Expand All @@ -238,7 +238,7 @@ Difyのドキュメント抽出器、あるいはMarketplaceから「Dify Extrac

</Accordion>

#### Doc Extractor(ドキュメント抽出器
#### Doc Extractor(テキスト抽出

<Frame>
![ナレッジパイプラインの編成 4 01](/images/use-dify/knowledge/knowledge-pipeline-orchestration-4-01.png)
Expand All @@ -247,7 +247,7 @@ Difyのドキュメント抽出器、あるいはMarketplaceから「Dify Extrac
情報処理の中核となり、入力変数からファイルを識別・読取・情報抽出を行い、次のノードで利用できる形式へ変換します。

<Tip>
詳細は[ドキュメント抽出器](/ja/use-dify/nodes/doc-extractor)をご参照ください。
詳細は[テキスト抽出](/ja/use-dify/nodes/doc-extractor)をご参照ください。
</Tip>

#### Dify Extractor
Expand Down
14 changes: 7 additions & 7 deletions ja/use-dify/nodes/doc-extractor.mdx
Original file line number Diff line number Diff line change
@@ -1,15 +1,15 @@
---
title: "ドキュメントエクストラクター"
title: "テキスト抽出"
description: "AI処理のためにアップロードされたドキュメントからテキストコンテンツを抽出"
---

<Note> ⚠️ このドキュメントは AI によって自動翻訳されています。不正確な部分がある場合は、[英語版](/en/use-dify/nodes/doc-extractor) を参照してください。</Note>


ドキュメントエクストラクターノードは、アップロードされたファイルを大規模言語モデルが処理できるテキストに変換します。言語モデルはPDFやDOCXなどのドキュメント形式を直接読み取ることができないため、このノードはファイルアップロードとAI分析の間の重要な橋渡し役を果たします。
テキスト抽出ノードは、アップロードされたファイルを大規模言語モデルが処理できるテキストに変換します。言語モデルはPDFやDOCXなどのドキュメント形式を直接読み取ることができないため、このノードはファイルアップロードとAI分析の間の重要な橋渡し役を果たします。

<Frame caption="ドキュメントエクストラクターノードの設定">
![ドキュメントエクストラクターノードの設定](https://assets-docs.dify.ai/dify-enterprise-mintlify/en/guides/workflow/node/f3853b40904e275da895711107e9c72f.png)
<Frame caption="テキスト抽出ノードの設定">
![テキスト抽出ノードの設定](https://assets-docs.dify.ai/dify-enterprise-mintlify/en/guides/workflow/node/f3853b40904e275da895711107e9c72f.png)
</Frame>

## サポートされているファイル形式
Expand Down Expand Up @@ -55,7 +55,7 @@ description: "AI処理のためにアップロードされたドキュメント

## 実装例

ドキュメントエクストラクターを使用した完全なドキュメントQ&Aワークフローの例です:
テキスト抽出ノードを使用した完全なドキュメントQ&Aワークフローの例です:

<Frame caption="ChatPDFスタイルのワークフロー実装">
![ChatPDFスタイルのワークフロー実装](https://assets-docs.dify.ai/dify-enterprise-mintlify/en/guides/workflow/node/f6ea094b30b240c999a4248d1fc21a1c.png)
Expand All @@ -65,7 +65,7 @@ description: "AI処理のためにアップロードされたドキュメント

**ファイルアップロード設定** - ユーザーからのドキュメントアップロードを受け入れるために、Startノードでファイル入力を有効にします。

**テキスト抽出** - ドキュメントエクストラクターを接続して、アップロードされたファイルを処理し、テキストコンテンツを抽出します。
**テキスト抽出** - テキスト抽出ノードを接続して、アップロードされたファイルを処理し、テキストコンテンツを抽出します。

**AI処理** - 抽出されたテキストを大規模言語モデルのプロンプトで分析、要約、または質問応答に使用します。

Expand All @@ -89,7 +89,7 @@ description: "AI処理のためにアップロードされたドキュメント

## 処理の考慮事項

ドキュメントエクストラクターは、異なるファイル形式に最適化された特殊な解析ライブラリを使用します。可能な限りテキスト構造と書式を保持し、抽出されたコンテンツを大規模言語モデル処理により有用にします。
テキスト抽出ノードは、異なるファイル形式に最適化された特殊な解析ライブラリを使用します。可能な限りテキスト構造と書式を保持し、抽出されたコンテンツを大規模言語モデル処理により有用にします。

### ファイル形式処理

Expand Down
2 changes: 1 addition & 1 deletion ja/use-dify/nodes/user-input.mdx
Original file line number Diff line number Diff line change
Expand Up @@ -101,7 +101,7 @@ description: "ワークフローとチャットフローアプリケーション

ユーザー入力ノードはファイルを収集するだけで、コンテンツを読み取ったり解析したりしないため、アップロードされたファイルは後続のノードによって適切に処理される必要があります。例えば:

- ドキュメントファイルは、LLM がそのコンテンツを理解できるように、テキスト抽出のためにドキュメント抽出器ノードにルーティングできます
- ドキュメントファイルは、LLM がそのコンテンツを理解できるように、テキスト抽出ノードにルーティングできます

- 画像は、ビジョン機能を持つ LLM ノードまたは専用の画像処理ツールノードに送信できます。

Expand Down
6 changes: 3 additions & 3 deletions ja/use-dify/tutorials/article-reader.mdx
Original file line number Diff line number Diff line change
Expand Up @@ -34,13 +34,13 @@ DifyでChatflowを作成し、モデルプロバイダーを追加して、十

ビジネスシーンに応じて、適切なファイルアップロード方法を選択してください。

### **テキスト抽出ツール**
### **テキスト抽出**

LLMはファイルを直接読み取ることができません。これは、多くのユーザーがファイルアップロード機能を初めて使用する際に抱く誤解であり、ファイルを変数としてLLMノードに適用すればよいと考えがちですが、実際にはLLMが読み取る内容は何もありません。

そのため、Difyではテキスト抽出ツールを導入しており、このノードはファイル変数からテキストを抽出し、テキスト形式の変数を出力します。
そのため、Difyではテキスト抽出ノードを導入しており、このノードはファイル変数からテキストを抽出し、テキスト形式の変数を出力します。

開始ノードのファイル変数を入力として、テキスト抽出ツールはドキュメント形式のファイルをテキスト形式の変数に変換します
開始ノードのファイル変数を入力として、テキスト抽出ノードはドキュメント形式のファイルをテキスト形式の変数に変換します
Comment on lines +41 to +43

<Frame>
![](https://assets-docs.dify.ai/dify-enterprise-mintlify/jp/workshop/intermediate/bc4b1492bd10ef782457ec6a709997f9.png)
Expand Down
Loading