语言模型_搜你所想

欢迎 Llama 3：Meta 的新一代开源大语言模型

Maker使用 🤗 TRL在单个 GPU 上对 Llama 3 8B 进行微调的示例 Llama 3 的新进展 Llama 3 的推出标志着 Meta 基于 Llama 2 架构推出了四个新的开放型大语言模型。这些模型分为两种规模：8B 和 70B 参数，每种规模都提供预训练基础版和指令调优版。所有版本均可在各种消费级硬件上运行，并具有 8000 Token 的上下文长度。 Meta-Llama-3-8b...

(view)

LM Studio：一个桌面应用程序，旨在本地计算机上运行大型语言模型（LLM），它允许用户发现、下载并运行本地LLMs

LM Studio是一个桌面应用程序，旨在本地计算机上运行大型语言模型（LLM）。它允许用户发现、下载并运行本地LLMs，支持在Windows、Linux和Mac等PC端部署2510。LM Studio的安装过程涉及访问其官网并选择相应操作系统的版本进行下载安装。安装成功后，用户可以通过该软件选择并运行心仪的模型，这些模型一般在huggingface上找到，重要因素包括模型的大小或参数量910。LM St...

(view)

LangChain：大型语言模型（LLMs）-- 基础知识

1、LangChain的调用大型语言模型模块的介绍 LangChain是一个强大的框架，旨在通过调用大型语言模型（LLM）来开发各种语言驱动的应用程序。在LangChain中，LLM不仅仅是一个简单的模型调用，而是一个复杂链条中的关键部分。这个链条可能包括数据检索、模型推理、上下文感知等多个环节，共同构成了LangChain的强大功能。 LangChain对LLM的调用进行了高度抽象和优化，使得开发者可...

(view)

大语言模型LLM《提示词工程指南》学习笔记04

文章目录大语言模型LLM《提示词工程指南》学习笔记04数据生成生成代码完成函数，继续下一行生成其他有用的代码，例如创建和测试MySQL查询代码解释提示函数大语言模型LLM《提示词工程指南》学习笔记04 数据生成 LLMs具有生成连贯文本的强大能力。使用有效的提示策略可以引导模型产生更好、更一致和更真实的响应。LLMs还可以特别有用地生成数据，这对于运行各种实验和评估非常有用。例如，我们可以使用它来...

(view)

LangChain：大型语言模型（LLMs）-- ChatGLM

1. 介绍 LangChain 是一个领先的框架，用于构建由大型语言模型（LLM）驱动的应用程序。在这个框架内，ChatGLM 作为一个重要的组件，为用户提供了强大的双语（中文-英文）对话功能。ChatGLM 基于通用的语言模型（GLM）框架，拥有数十亿级别的参数，确保了其对话的流畅性和准确性。通过量化技术，用户甚至可以在消费级显卡上进行本地部署，大大降低了使用门槛。随着技术的不断进步，ChatGLM...

(view)

ChatGPT 之改变世界的革命性的语言模型

简介：ChatGPT 是一种最先进的语言模型，改变了人类与技术互动的方式。在本书中，我们探讨了 ChatGPT 从一个小型项目发展到如今成为全球现象的历史。通过与 ChatGPT 的创造者和开发者以及受到该技术影响的人们的访谈，我们深入了解了这种语言模型如何革新各个领域。我们了解到 ChatGPT 如何提高了自然语言处理的准确性，使得机器能够以前所未有的水平理解人类语言。我们探讨了 ChatGPT ...

(view)

微软&卡内基梅隆大学：无外部干预，GPT4等大语言模型难以自主探索

强化学习中的探索能力探究在强化学习和决策制定的核心能力中，探索（exploration）扮演着至关重要的角色。探索能力指的是智能体为了评估不同选择并减少不确定性而有意识地收集信息的能力。近年来，大型语言模型（Large Language Models，简称LLMs）在多种任务中展现出了令人瞩目的性能，特别是在无需训练干预的情况下，通过上下文学习（in-context learning）来解决问题。然而，...

(view)

大语言模型LLM《提示词工程指南》学习笔记02

文章目录大语言模型LLM《提示词工程指南》学习笔记02设计提示时需要记住的一些技巧零样本提示少样本提示链式思考（CoT）提示自我一致性生成知识提示大语言模型LLM《提示词工程指南》学习笔记02 设计提示时需要记住的一些技巧指令您可以使用命令来指示模型执行各种简单任务，例如“写入”、“分类”、“总结”、“翻译”、“排序”等，从而为各种简单任务设计有效的提示。具体性对您希望模型执行的指令和任务非...

(view)

阿里云PAI + pytorch大语言模型开发环境简介

文章目录阿里云PAI + pytorch大语言模型开发环境简介PAI-DSW 快速入门1. 安装和配置2. 模型训练2.1 数据集准备2.2 模型训练脚本准备2.3 提交训练作业 3. 部署模型为推理服务4. 调用推理服务阿里云PAI + pytorch大语言模型开发环境简介 PAI-DSW 快速入门阿里云机器学习PAI（Platform of Artificial Intelligence）是...

(view)

优化大型语言模型表现的策略与方法

在人工智能的世界里，大型语言模型如同 GPT-4 这样的存在，已经成为了一个璀璨的明星。这些模型的强大之处在于它们能够处理各种语言任务，比如写作、翻译和提问等。但是，想要让这些模型发挥出最大的作用，我们需要掌握一些技巧来提升它们的表现。本文将介绍一些实用的策略。一、明确你的需求在与语言模型的互动过程中，我们需要详细地阐述任务和要求。由于这些模型不具备读心能力，因此我们需要提供充足的信息，以便模型能够理...

(view)

上一页 1 2 3 4 5 6 7 8 下一页