大模型在推荐领域的应用
本文范式取自参考文献[3],内容贴近工业界推荐系统。在遵循其分类范式基础上,补充了一些学术届和工业界的相关工作. 1. 相关背景 1.1. 现代推荐系统架构 推荐系统的核心任务就是在给定一个用户$u \in \mathbb{U}$和上下文$C$的情况下,推荐一批排好序的items:$[i_k]^N_{k=1}$,$\mathcal{i}k \in \mathscr{I}$即: ...
>
本文范式取自参考文献[3],内容贴近工业界推荐系统。在遵循其分类范式基础上,补充了一些学术届和工业界的相关工作. 1. 相关背景 1.1. 现代推荐系统架构 推荐系统的核心任务就是在给定一个用户$u \in \mathbb{U}$和上下文$C$的情况下,推荐一批排好序的items:$[i_k]^N_{k=1}$,$\mathcal{i}k \in \mathscr{I}$即: ...
1. 背景 春节期间,DeepSeek爆火出圈,性能在开源和闭源模型中达到顶尖水平,同时显著降低了训练和推断成本,并在推理领域取得重大突破,被誉为开源领域的"ChatGPT时刻"。R1模型是DeepSeek一年来持续探索与积累的成果,体现了算法、架构与硬件的协同设计。本文将重点解析R1模型的核心算法,并简要介绍其基础设施。 ...
资料参考自AICon2024、《艾瑞咨询:2023年中国AIGC产业全景报告》、《艾瑞咨询:2023年中国人工智能产业研究报告》 1. 参会感受 大模型技术更新速度大于商业决策速度! ...
1. 相关背景 1.1. 对话系统的定义 对话系统(Dialogue System,有时也称ChatBot)是人机交互技术(Human Computer Interaction, HCI)的核心领域,旨在最大限度地模仿人与人之间的对话方式,使得人类能够用更自然的方式和机器进行交流,帮助人类完成任务、获取信息、情感陪伴等。 ...
在过去的一年中,大模型领域呈现出了迅猛的发展态势,相关文献数量庞大。这给希望了解该领域的同学带来困扰:直接深入研读众多论文比较耗费精力,而综述文章则可能缺乏必要的细节。在此背景下,希望在自我学习的过程中能够总结出一些核心要点,与大家共同学习。鉴于个人的精力和能力均有限,如有错误或疏漏,还望不吝赐教。文中大量观点和图表都出自最后的参考文献,因内容较多,不在原文一一标注出来了。 ...
1. NLP发展历程与模型架构 NLP的发展渐趋于统一化:在深度学习时代到来之前,NLP任务高度依赖于手工设计的复杂特征。随后,深度学习的出现极大地减轻了这种特征工程的负担。以BERT和GPT-1为代表的预训练和微调范式,标志着手工特征设计时代的终结。大模型的出现宣告了NLP中间任务的消亡,所有任务都可以统一到语言模型的范畴中。 ...
1. AI电商概述 AI电商指借助AI技术,赋能各类型电商与行业模块,通过各类AI相关落地应用,从而对行业产生流量逻辑、用户体验、行业效率等影响价值。 ...