一架梯子,一头程序猿,仰望星空!
使用LangChain提取结构化数据

使用LangChain提取结构化数据

本教程展示了LangChain框架如何通过大型语言模型(LLM)提取结构化数据。
  • 1. 快速开始

    本教程主要介绍借用大模型的**函数/工具调用**能力,实现结构化数据提取功能。

  • 2. 指南

    LangChain数据提取指南

  • 3. 使用参考示例

    通过向LLM提供参考示例,通常可以改善提取数据的质量。

  • 4. 处理长文本

    本章讨论如何使用不同的方法处理长文本,如改变LLM,用蛮力分块,以及基于RAG的文本处理分块。它包括设置数据提取模式,并合并从文档块中提取的信息。

  • 5. 处理文件

    除了原始文本数据,您可能希望从其他文件类型(如PowerPoint演示文稿或PDF文件)中提取信息。

  • 6. 解析

    前面的章节基于大模型(LLM)的函数/工具调用特性实现数据提取,那么如果你使用的LLM不支持函数调用特性,我们可以基于提示词指令要求LLM返回指定格式的数据,然后通过代码转换LLM返回的文本数据。本章主要基于这个思路讲解如何提取结构化的数据。