异度部落格

LLM Agent设计模式 - Plan-and-Solve

Posted on 2024-08-08 In LLM技术内幕

Plan-and-Solve (PS) 设计模式通过将任务分解为子任务并按计划执行，提升了大型语言模型在多步推理任务上的表现。

LLM Agent设计模式 - ReAct

Posted on 2024-08-07 In LLM技术内幕

ReAct 设计模式通过交替使用推理和行动步骤，让大型语言模型（LLM）在解决复杂任务时更加可靠和准确。它有效减少了错误传播，提升了模型的可解释性和决策成功率。

LLM模型推理入门

Posted on 2024-07-28 In LLM技术内幕

随着生成式 AI 的迅速发展，大语言模型（LLM）的推理性能和成本成为关键障碍。本文从Transformer介绍入手，探讨了 LLM 推理的推理过程，并介绍了通过算法创新和系统优化提升推理效率的方法。

Rockset技术架构解析

Posted on 2024-07-21 In 分布式系统

Rockset是一家专注于实时分析和混合检索的数据管理公司，提供高效的实时查询和分析功能。其核心技术包括融合索引和云原生架构，支持多种数据类型的混合检索，并且在实时数据更新和查询性能方面表现优异。2024年，Rockset被OpenAI收购，进一步提升了其在大规模数据分析和管理领域的应用潜力。

如何利用提示词攻破ChatGPT

Posted on 2024-07-01 In LLM技术内幕

提示词攻击利用大语言模型的特性，通过特定提示词诱导模型生成特定输出，包括恶意攻击、数据提取等。越狱技术旨在绕过模型限制，泄露机密信息或执行不当逻辑。两者都利用模型的脆弱性进行操控。

提示词工程简介

Posted on 2024-06-30 In LLM技术内幕

提示词工程（Prompt Engineering）是一种优化和设计提示词的技术，旨在更好地引导和控制生成式人工智能（如 GPT-4）的输出。通过调整参数如 temperature、top_p、max length 等，提示词工程能够显著提升生成模型的表现和输出质量。

AI大模型：技术变革与行业思考

Posted on 2024-06-22 In 杂七杂八

本文探讨了人工智能大模型的技术变革以及其对行业上下游影响。同时，记录了个人对AI大模型的一些思考。

MLSys技术内幕系列 -NVIDIA GPU原理详解

Posted on 2024-06-08 In MLSys技术内幕

本文从AI芯片的基础知识入手，介绍了GPU的基本概念和工作原理，重点解析了NVIDIA GPU的核心架构及其从Fermi到Hopper的演进历程。通过阅读本文，您将全面了解GPU在现代计算中的重要性及NVIDIA在图形处理和并行计算领域的技术创新。

MLSys技术内幕系列 - MLSys概述与学习资料

Posted on 2024-06-06 In MLSys技术内幕

MLSys 是机器学习（Machine Learning）和系统科学（Systems）的交叉领域，旨在优化和增强机器学习算法和应用的系统性能、效率与可用性。该领域涉及的关键研究方向包括系统架构与硬件优化、数据管理与处理、模型训练与优化、推理与部署、系统自动化与自适应，以及利用机器学习优化传统系统问题。

投资的“四笔钱”

Posted on 2024-05-27 In 投资理财

“四笔钱”是对标准普尔家庭资产配置的改进方案，解决了如何合理分配投资资金的问题。该方法将资金分为四类：活钱管理、稳健理财、长期投资和保险保障。