从 Google 到 LinkedIn,所有领先的发现平台都已集成了 AI 代理,为各种内容创建者提供了新兴的盈利机会。AI 实际上正在为各种数据供应商和出版商开启另一个级别的在线联合:将数据、文章、图像和媒体集成到 LLM 驱动的系统中,这些系统实际上可以生成有用的响应,帮助最终用户在线做更多的事情。
随着人工智能平台的发展,获取大量高质量数据的需求也日益强烈。OpenAI、Meta 和 Google 等公司已 拉脱维亚数字数据 经获取了大量信息,内容提供商要求在人工智能革命中分一杯羹,从而引发了一波法律纠纷和专有交易:《纽约时报》起诉 OpenAI 等备受瞩目的法律行动说明了内容权利在人工智能领域的重要性。内容所有者质疑人工智能公司在没有明确许可或公平报酬的情况下使用专有数据训练模型的合法性。这些案件不仅凸显了明确合理使用和许可的必要性,也凸显了内容提供商和科技公司在知识产权方面的紧张关系。
为了应对这些争议,直接许可协议开始成为一种更直接的替代方案。例如,OpenAI 已经建立了一个框架,用于从 Axel Springer 等领先的出版商网络获得 AI 培训数据许可。这些合作伙伴关系标志着一个关键的转变,但它们实际上并没有提供公平报酬和货币化的解决方案:出版商会因使用数据进行培训而提前获得大笔报酬,但如今这种联系并不是实时的,事实调查员或数据组织没有途径直接因将有价值的数据转化为 LLM 而获得奖励。
但出售数据并不是一劳永逸的解决方案:为了获得有用的 AI 访问,数据应正确格式化以供 LLM 提取,以确保 AI 体验不太可能产生幻觉,而更有可能产生有价值、准确的响应。这就是Dappier等工具的作用所在:将数据转换为“AI 就绪”格式,Dappier 将实时数据集转换为检索增强生成 (RAG) API,使供应商能够实时使 AI 应用程序访问他们的数据集。通过Dappier RAG API 市场,内容提供商可以设置价格点和权限,从而使内容提供商可以轻松地将其数据授权给 AI 开发人员。