大语言模型应用
时代在召唤
大模型时代,学习和记录一些基于大语言模型构建和部署应用程序的方法和工具。
AI应用=大语言模型+交互+记忆+多模态
当然,现在主打一个提示工程(prompt engineering)。大模型才是长期记忆力,向量数据库是短期记忆。可能由更多模型组成的交互群体记忆会更牛逼。
AI Agent
规划(Planning)、 记忆(Memory)和工具使用(Tool Use)
应用框架
LangChain是一个由Harrison Chase创建的开源项目,旨在让开发者能够利用语言模型的强大功能,创建出不仅仅是调用API的应用程序,而是能够连接其他数据源,与环境交互,实现自主决策的应用程序。LangChain提供了多种语言(如Python和JavaScript)的支持,以及针对不同用例(如自主代理,个人助理,问答系统,聊天机器人等)的高级接口。LangChain还提供了一些实用工具,如提示优化,记忆管理,索引构建等,以帮助开发者提高语言模型的性能和效率。
目前OpenAI已经增加不少LangChain的功能,如函数调用。
向量数据库
通过外部的存储来增强模型的记忆。
向量嵌入是一种将复杂数据(如文本,图像,视频等)转换为数值向量的机器学习技术,可以用于表示数据的语义和特征。向量数据库是一种专门用于存储和检索向量嵌入的数据库。它可以通过计算向量之间的相似度,实现高效的相似性搜索功能,从而支持语义搜索,推荐系统,异常检测等应用场景。
Pinecone
Pinecone提供了一个完全托管的云原生向量数据库,开发者可以更高效地存储和检索向量嵌入。
Weaviate
开源
Chroma
开源,轻量级
Milvus
国产,对标Pinecone
Vespa
开源
Redis
传统数据库积极进入市场
模型记忆相关研究和应用
AutoGPT
把事情记录到向量数据库,会定期的对记忆进行复盘,决定接下来的执行计划。
把行为和推理的中间步骤展示出来,也是一种可解释性。
SmallValle小镇(Generative Agents: Interactive Simulacra of Human Behavior)
Agent的记忆系统还交织了彼此的信息,展现出了一定的人类特征。