AIGC行业今日商机情报（9月20日）

《大语言模型测评分析报告》在2023世界计算大会上发布

中国软件评测中心发布《大语言模型测评分析报告》，从基础通用能力、行业领域知识、安全能力三大维度对多个主流大模型进行测评。报告指出，大模型在语言理解、对话问答、内容生成、多语种交互、逻辑推理与数学应用、代码编程等方面表现良好，但存在一些不足。建议加强中文语料训练、监督逻辑推理等，控制大模型的“幻觉”，以促进其健康发展和应用落地。中国软件评测中心将持续完善测评规范和测试数据集，支撑大模型的发展与应用。

模型语言文本可读性代码

10个2023年最具影响力的开源大语言模型

MPT系列推出了重要的几个模型，包括MPT-7B、MPT-7B-StoryWriter和MPT-30B。

模型 Falcon 微调训练 T5

谁在评价大模型?AI大模型评测榜单乱象调查

Meta发布开源大模型LIama2，并公开了在GSM8K和MMLU两款评测集上与闭源GPT-3.5的对比结果。该模型源自伯克利大学，具备多个学科的综合知识能力，被用于GPT-3.5、GPT-4和PaLM系列大模型的研发过程，并得到国内科技大厂的认可和使用。

评测模型榜单 GPT GPT4

学术出版AIGC边界指南发布:使用AIGC需声明,否则将构成学术不端

中国科学技术信息研究所联合爱思唯尔、施普林格·自然、约翰威立国际出版集团发布《学术出版中AIGC使用边界指南》，对人工智能内容生成（AIGC）用于学术出版的规范进行界定。指南明晰了相关利益主体在学术期刊论文准备、写作、投稿、评审、出版、传播各环节应履行的最佳行为实践，提供规范的AIGC使用指导。建议研究人员使用AIGC直接生成的稿件文字等资料必须提供明确的披露和声明，否则将构成学术不端行为，同时也对学术出版流程中不可使用AIGC的情况进行了说明。该指南强调对AIGC使用情况进行充分、正确的披露和声明，并要求在方法或致谢部分中公开详细地描述使用此类工具撰写的稿件的任何部分。

AIGC 学术指南文本环节

最顶尖的大语言模型人才，在关心这10个研究方向

经过与工业界和学术界的交流，总结出十个主要的研究方向。其中，减少和衡量幻觉以及优化上下文长度和上下文构建是当前最受关注的两个方向。

模型 Language 幻觉 LLM 模态

ChatGPT竞争对手Writer获B轮1亿美元融资

生成式AI平台Writer宣布获得1亿美元融资，提供企业领域的文本生成、摘要、纠错等功能，数据安全和操作透明是其主打亮点。Writer在过去两年实现了10倍的收入增长，并获得了知名企业的信赖。该平台拥有可解释性和透明化操作特点，提供文本问答自动生成内容、总结摘要、自定义UI模版等个性化功能，适用于医疗、营销、市场等各个主流业务场景。

Writer 文本微调 GPT UiPath

开启网安发展新范式,安全行业大模型赋能之路

绿盟科技基于人工智能技术推出《安全行业大模型SecLLM技术白皮书》，分享其在安全行业大模型研发中的最佳实践与经验教训，为安全行业提供定制的大模型解决方案。该白皮书涉及安全专业知识缺乏、数据隐私与安全、模型可信安全保障等方面的问题。绿盟安全行业大模型应用包括安全知识库、多源情报分析和安全攻防智能化等。安全行业大模型的发展将促进网络攻防的智能化和自动化，带来新的突破。

安全模型绿盟 ChatGPT 关键技术

DeepMind发现AI大语言模型可以优化自己的prompt提示

DeepMind的研究人员提出了一种新的优化方法：通过提示进行优化（OPRO），使用大型语言模型（LLM）作为优化器。这种方法通过自然语言描述优化问题并使用LLM迭代地生成新的解决方案。研究人员发现，OPRO在小规模优化问题上的表现令人鼓舞，并可以优化LLM提示以提高准确性。此外，研究人员还发现OPRO可以优化像OpenAI的ChatGPT和Google的PaLM这样的LLM的提示，从而指导它们找到最佳提示以最大化任务准确性。虽然OPRO展示了LLM的优势，但其内部工作原理仍需要进一步研究和理解。

LLM 模型优化器解决方案

百度发布“共拓计划”:AIGC能力赋能14万客户,视频制作成本下降85%

百度营销“共拓计划”战略合作正式启动，10余家行业生态合作伙伴参与，共同开启百度AIGC技术能力为营销创造的AI生态图景。据介绍，“共拓计划”将开放百度在商业上沉淀的、非常丰富的AIGC通用API能力接口，旨在提升合作伙伴的效率及效果，并共建、深耕千行百业的繁荣应用生态。百度商业研发部总监表示，百度已成功渗透14万个账户，覆盖32个一级行业，并将继续推进AIGC营销规模化应用，助力企业全面释放AIGC营销能力。

百度 AIGC 营销拓代理商

综述：基于大语言模型的智体

同样，大型语言模型在大规模语料库上进行预训练，并展示了少样本和零样本的泛化能力，允许在任务之间无缝迁移，无需更新参数[41; 105; 106; 107]。基于LLM的智体已被应用于各种现实世界的场景，例如软件开发[108;109]和科学研究[110]。后一种方法认为，智体在最终确定规划之前应该评估所有可能的路径[97;181;184;257;184]。

LLM 任务记忆模型语言

阿里旗下公司新增人工智能品牌发布多款AIGC终端与个性化助手

9月19日午间消息，阿里巴巴旗下人工智能业务公司未来精灵正式面世。天猫精灵APP近日也将升级为未来精灵APP，将陆续开放在内容推荐、家庭中控和更多插件场景的AIGC能力。近期，基础模型与对话系统算法均完成备案，已宣布首批10款产品升级大模型和AIGC能力，“很快会有千万用户体验个性化大模型。”据介绍，天猫精灵仍是产品线品牌和用户可用唤醒词，此前服务承诺不会变化。未来精灵公司将持续聚焦对话式AI，加大产品技术投入。

精灵模型助手插件个性化

FlagEval大语言模型评测9月榜:Baichuan 2排名第一

FlagEval大语言模型评测体系当前包含6大评测任务，近30个评测数据集，超10万道评测题目。据悉，在9月评测中，FlagEval进行了评测框架升级，细化「安全与价值观」与「推理能力」。基于最新CLCCv2.0主观评测数据集，FlagEval（天秤）9月榜重点评测了近期大热的7个开源对话模型。从整体结果来看，Baichuan2-13b-chat、Qwen-7b-chat、Baichuan2-7b-chat名列前茅，准确率均超过65%。在SFT模型榜单中，Baichuan2-13B-chat、YuLan-Chat-2-13B、AquilaChat-7B名列前三。另外，值得注意的是，在客观评测两个榜单中，Baichuan2均表现出优异性能，基础模型测试在中英文领域均全面超越Llama2。

评测模型天秤榜单网站

每周技术分享9：在多模态大语言模型中实现可视化基础- BuboGPT

大型语言模型通过语言与人类的互动展示了卓越的能力，尤其是在使用遵循指令的数据时。然而，尽管在生成给定模态信号的精确和详细的语言理解方面表现出效果，这些LLMs却放弃了定位输入特定部分的能力，从而仅构建了粗粒度的映射。所以，当BuboGPT为图像中的对象生成响应或描述时，它能够准确指示该对象在图像中的特定位置。本文中的这项研究提出了BuboGPT，将视觉定位引入LLMs，以建立视觉对象与其他模态的关联。

模态 LLM 图像音频视觉

Soul App积极布局AIGC领域,以“AI苟蛋”助力社交体验革新

2020年,Soul启动了对AIGC技术的研发工作,积极涉足智能对话、图像生成、语音技术等领域。2022年,Soul正式上线了智能对话机器人“AI苟蛋”。不仅如此,Soul将人设受控数据纳入大语言模型,允许用户对AI苟蛋进行自定义,如性别、年龄、兴趣等。在业务阶段,Soul将智能对话机器人“AI苟蛋”与站内多元社交场景相结合,不断提升其交互能力。未来Soul期望利用AIGC共建一个虚拟人和真人共存的社交平台。通过对AIGC领域的持续探索和创新,Soul正在为社交体验带来全新的革命性变革。

Soul AIGC 社交对话用户