大语言模型应用

时代在召唤

大模型时代,学习和记录一些基于大语言模型构建和部署应用程序的方法和工具。

AI应用=大语言模型+交互+记忆+多模态

当然,现在主打一个提示工程(prompt engineering)。大模型才是长期记忆力,向量数据库是短期记忆。可能由更多模型组成的交互群体记忆会更牛逼。

AI Agent

规划(Planning)、 记忆(Memory)和工具使用(Tool Use)

应用框架

LangChain是一个由Harrison Chase创建的开源项目,旨在让开发者能够利用语言模型的强大功能,创建出不仅仅是调用API的应用程序,而是能够连接其他数据源,与环境交互,实现自主决策的应用程序。LangChain提供了多种语言(如Python和JavaScript)的支持,以及针对不同用例(如自主代理,个人助理,问答系统,聊天机器人等)的高级接口。LangChain还提供了一些实用工具,如提示优化,记忆管理,索引构建等,以帮助开发者提高语言模型的性能和效率。

目前OpenAI已经增加不少LangChain的功能,如函数调用。

向量数据库

通过外部的存储来增强模型的记忆。

向量嵌入是一种将复杂数据(如文本,图像,视频等)转换为数值向量的机器学习技术,可以用于表示数据的语义和特征。向量数据库是一种专门用于存储和检索向量嵌入的数据库。它可以通过计算向量之间的相似度,实现高效的相似性搜索功能,从而支持语义搜索,推荐系统,异常检测等应用场景。

  • Pinecone

    Pinecone提供了一个完全托管的云原生向量数据库,开发者可以更高效地存储和检索向量嵌入。

  • Weaviate

    开源

  • Chroma

    开源,轻量级

  • Milvus

    国产,对标Pinecone

  • Vespa

    开源

  • Redis

    传统数据库积极进入市场

模型记忆相关研究和应用

  • AutoGPT

    把事情记录到向量数据库,会定期的对记忆进行复盘,决定接下来的执行计划。

    把行为和推理的中间步骤展示出来,也是一种可解释性。

  • SmallValle小镇(Generative Agents: Interactive Simulacra of Human Behavior)

    Agent的记忆系统还交织了彼此的信息,展现出了一定的人类特征。