6月5日,开放式大豆产业大语言模型“问豆”(SoyAI)在南京农业大学正式发布。这款大语言模型由国家大豆生物育种产教融合创新平台牵头打造,可将海量大豆行业数据转化为优质专业知识,精准服务农户、农技人员、科研工作者和涉农院校师生群体。

  打造“大豆智库”,海量数据淬炼优质专业知识

  近年来,在国家大豆生物育种产教融合创新平台的牵头组织下,“问豆”研发团队系统梳理收录大豆育种、栽培、施肥、病虫害防治、气象灾害应对、品种资源、产业政策与市场行情等全领域的学术文献、学位论文、技术手册、行业报告及政策标准,依托超15亿词元(token)的专业语料,搭建起体量庞大、维度全面的大豆专属专业语料库。

  “研发‘问豆’大语言模型,96%的工作都集中在数据环节——不仅要保障数据体量充足、品类丰富,更要严控数据质量。”南京农业大学信息管理学院副院长王东波表示,垂直领域大模型的核心竞争力,在于对高质量专业数据的萃取与整合能力。

  为保障模型输出内容专业、精准、可靠,“问豆”创新构建深度贴合领域专家思维的三阶段递进式问答架构。

  第一阶段为需求解析,智能提取用户提问中涉及的品种、病害、土壤、肥料、农机、加工、市场等核心关键信息,精准细化、聚焦用户实际需求。

  第二阶段为知识融合,整合本地专属知识库、权威搜索引擎、学术数据库等多源信息,对照国家官方品种审定、农药登记、肥料认证等权威标准资料完成初步筛选过滤,为模型筑牢高质量专业知识基础。

  第三阶段为高质量数据合成与结果输出,研发团队对专业数据、行业报告、学位论文等各类资料进行精准筛选与规范标注,以专家认证、官方审定数据和行业技术标准为刚性准则,对大语言模型的内容生成能力进行严格约束,确保所有输出内容均有据可依、合规专业。

  整合跨学科经验,构建智能决策网络

  田间的实际生产难题,往往关联品种抗性、土壤墒情、气象变化等多重因素,需要多维度综合研判。而“问豆”大语言模型可有效整合分散在各学科领域的行业经验,构建出可计算、可推导、可落地的大豆产业智能决策网络。

  南京农业大学国家大豆改良中心主任赵晋铭特别强调:“信息科学为模型提供了海量数据处理的算法与技术框架,种子科学与工程、植物保护、农业资源与环境等涉农学科,则明确了产业问题的研究边界与知识判定标准,多学科知识打通融合、相互印证,才能形成经得起田间实操检验的科学决策依据。”

  南京农业大学植物保护学院教授叶文武指出:以往大豆病虫害诊断工作高度依赖基层农技人员个人经验,形成诸多信息闭塞的“经验孤岛”。如今,“问豆”不仅可精准诊断大豆病虫害类型,还能结合大豆生育阶段、气象数据模型等多维信息预判病虫害风险,智能生成包含生物防治、科学用药等内容的绿色防控方案。

  从病虫害绿色防控、气象灾害科学应对,到大豆品种甄选、产业政策与市场行情研判,“问豆”大语言模型的落地应用,彻底改变大豆生产“凭经验决策”的传统模式,助力田间生产迈向全产业链知识协同的精准化、科学化决策新阶段。

  打通农技服务“最后一公里”,赋能产业生态升级

  在产业供给端,“问豆”大语言模型全面汇聚、贯通大豆全产业链科技创新知识与数据资源;在应用服务端,以专业性、低门槛的智能问答形式,面向广大农户、基层农技推广人员、科研工作者和农业院校学生全面开放。

  “大豆产业事关国家粮食安全,种业振兴核心离不开科技赋能。南京农业大学深耕大豆育种领域百余年,搭建的创新服务体系,通过大模型实现了农业历史经验与实时前沿知识的系统化整合”。中国工程院院士、国家大豆生物育种产教融合创新平台主任盖钧镒表示,“‘问豆’大语言模型的核心使命,是将优质专业的大豆产业知识普及到田间地头、送到一线从业者手中,让农业科技真正扎根大地、赋能产业发展。”

  南京农业大学副校长王源超表示,顺应农业数字化转型和国家种业振兴的迫切需求,打通基层农技服务“最后一公里”意义重大。“问豆”大语言模型不仅能推动产学研用深度融合,也为涉农专业学生搭建了实践新平台,学生可在模型使用与反馈优化过程中,探索人工智能与现代农业深度融合的新路径,成长为懂农业、懂科技、懂数字的复合型新农科人才。

   “问豆”大语言模型的正式发布,是南京农业大学继“司农”“问梨”“绿盾”等农业大语言模型及智能体之后的又一重要成果。未来,研发团队将持续迭代优化模型性能,丰富拓展应用场景,持续释放人工智能技术效能,助力农业产业数字化、现代化转型升级。