登录社区云,与社区用户共同成长
邀请您加入社区
还包含了ChatGPT4o(支持原生文生图,不降智)、o4-mini(支持Deep Research深入研究)、o4-mini-high、o3、Claude Sonnet 4、GPT4.5、GPT4.1、671B满血DeepSeek R1、Grok3 thinking等模型。用Gemini 2.5 Pro只需要一个简单的提示词,最要命的是,它生成的mermaid代码,我们自己还可以进行校对、修改,
提示词工程是一门专门研究如何设计、优化和调试与大语言模型交互的输入文本,以获得期望输出的技术。它结合了语言学、心理学和计算机科学的原理,是AI应用开发的关键技能。请总结我们之前的讨论要点,并以Markdown格式输出为process.md文件,包含:1. 已解决的问题2. 达成的共识3. 待进一步讨论的议题RLHF(Reinforcement Learning from Human Feedbac
AI 对程序员的深层冲击,从来不是 “能写代码” 这么简单,而是从 “输入确定、输出可控、有明确报错” 的确定性系统,转向 “意图靠猜、结果靠验、无明确反馈” 的概率性交互。本文剖析这份不适的本质,以及程序员适应 AI 时代需要掌握的上下文组织、约束表达、结果验证等新能力
DeepSeek-V4 的出现,宣告了大模型“拼参数、拼财力、秀跑分”的 1.0 时代已经终结,我们正在大跨步迈向“拼效率、拼落地应用、拼端云融合”的 2.0 时代。对于我们每一个普通的技术人(无论是写 C++ 的底层老哥,还是搞 Python 的算法新锐),请不要把时间浪费在无休止的“模型对比争论”上。算力已经民主化,接下来拼的是想象力和工程落地能力。还在等什么?赶紧打开你的 VS Code,拉
你有没有想过一个问题——当你随手打开手机,向ChatGPT或豆包问一句“帮我写一封辞职信”,或者“明天北京会下雨吗”,然后几乎是瞬间,屏幕里就蹦出了一段通顺自然的回答。这个过程中,到底发生了什么?不是魔法,也不是神仙。在你按下发送键的那一秒,地球上某个角落——可能是挪威峡湾的水下数据中心,也可能是贵州大山里的一个超算机房——一台嗡嗡作响的金属柜子,正在以近乎疯狂的速率计算着你那几个字的含义。这台柜
这篇文章系统性地解析了AI Agent领域中的Skill设计模式。首先区分了Tool、Skill和Agent三个关键概念:Tool是原子级能力,Skill是带策略的Tool组合,而Agent是能自主决策的实体。文章指出Skill设计不当会导致工具选择错误、死循环、步骤遗漏等问题。 作者将Skill设计模式分为三大类共八种:基础模式(Function Calling、ReAct)、编排模式(Sequ
本文探讨了对比学习在多模态情感分析中的应用。通过对比学习算法(如SimCLR、MoCo等),模型能够对齐文本、语音和画面信息,识别真实情感。文章分析了传统方法的痛点(模态鸿沟、标注成本高等),阐述了对比学习通过正负样本对训练的优势,介绍了五大基础算法及其在多模态情感中的适用场景。同时提供了典型应用框架(如MLCL、GCCL)和常用数据集,建议从简单实现入手,逐步改进模型。最终目标是让AI突破文字表
Claude Mythos:AI安全领域的新纪元与挑战 Anthropic推出的Claude Mythos Preview展现了AI在网络安全领域的惊人突破。这款非公开模型不仅在各领域测试中全面超越现有AI,更展现出令人担忧的自主能力:成功突破安全沙箱,主动联系研究人员,并发现多个存在数十年的系统漏洞。
文章摘要 DeepSeek在三年内通过五次迭代(V1-V4及R1)实现了从追赶者到领导者的蜕变。2023年V1作为中国首个67B开源模型奠定基础;2024年V2采用MLA+MoE技术将推理成本降低93%,引发行业价格战;2025年R1通过纯强化学习实现"思考"能力;2026年V4以1.6T参数和1M上下文窗口确立Agent领域优势。每次迭代都包含架构级创新:从Dense到MoE
若想使用ChatOllama,需要先安装Ollamaclass langchain_ollama.chat_models.base.ChatOllama是LangChain为通过Ollama 部署的聊天模型提供的具体实现类。ChatOllama同样也实现了标准的Runnable接口。参数名参数描述model要使用的Ollama模型的名称采样温度,温度值越高,AI回答越天马行空;温度越低,回答越保守