CCF大数据与计算智能大赛(CCF Big Data & Computing Intelligence Contest,简称CCF BDCI)由中国计算机学会于2013年创办,是大数据和AI领域的算法、应用和系统大型挑战赛事。大赛面向重点行业和应用领域征集需求,以前沿技术与行业应用问题为导向,以促进行业发展及产业升级为目标,以众智、众包的方式,汇聚海内外产学研用多方智慧,为社会发现和培养了大量高质量数据人才。
大赛迄今已成功举办十一届,累计吸引全球25个国家,1500余所高校、1800余家企事业单位及80余所科研机构的20万余人参与,已成为中国大数据与AI领域影响力最广、参赛规模最大、成熟度最高的综合赛事之一。
在探索未知的路上深耕十余年,我们始终致力于挖掘数据潜能、构建健康数据生态。2024年,第十二届CCF BDCI将聚焦数字化的经济前沿技术与人才培育,携手业界精英,共助大数据技术及产业蓬勃发展、加速开启数据智能新篇章。
赛题任务:参赛者需要开发一个智能问答系统,能够准确回答关于TuGraph-DB的各类问题。
赛题名称:「AI for TuGraph」小样本条件下的自然语言至图查询语言翻译大模型微调
赛题任务:参赛者需要用提供的在TuGraph-DB上可执行的Cypher语料,对一个指定的本地模型进行微调,使得微调后的模型能够准确的将测试集中的自然语言描述翻译成对应的Cypher语句,翻译结果将基于文本相似度和语法正确性两个方面综合评分。
赛题名称:基于Intel Gaudi AI加速器的大语言模型微调与推理优化
赛题任务:参赛者使用基于东方国信幕僚智算云平台上带有1块Intel Gaudi AI加速卡的虚拟机,编写Lora微调和推理脚本,使用ChatGLM3-6B模型和给定的数据集进行微调,并在微调后的模型上进行推理。虚拟机用于脚本的开发与测试。
赛题任务:本赛题要求选手使用运营商相关的文档构建知识库,按照每个用户问题检索知识库并返回答案所在的文本块。
赛题任务:本次比赛致力于利用TPU平台(Milk-V Duo系列开发板)实现低精度(INT8或FP16或)量化OCR模型,落地端侧场景。参赛者将在Milk-V Duo上进行模型部署,不仅要考虑文字识别的质量,同样要考虑模型的部署成本,即同时提升模型的精度与推理速度。
训练赛于2024年10月中旬开放;训练赛作品提交截止时间为2024年11月30日,并评优评奖,后续视赛题情况做长期开放。备注:以上赛程及时间安排根据真实的情况调整。
CCF大数据专家委员会、CCF自然语言处理专业委员会、CCF高性能计算专业委员会、CCF计算机安全专业委员会、CCF计算机应用专业委员会、CCFAI与模式识别专业委员会、易班网、LandInn清研兰亭