YouTube未授权数据使用引关注,苹果、英伟达等科技企业陷“偷用”争议?

文|罗曾

随着人工智能技术的飞速发展,数据已成为AI训练不可或缺的资源,如何合法、合规地获取和使用数据,已成为行业发展的重要课题。而近期媒体曝光的“偷用”事件,将苹果、英伟达在内的科技巨头推至风口浪尖。

7月17日,据媒体报道,苹果、英伟达、Salesforce和Anthropic等知名公司被指在训练其AI模型时,使用了未经授权的YouTube视频字幕数据。

据悉,该数据集名为“YouTube Subtitles”,规模庞大,总大小达到5.7GB,包含4.89亿个单词,覆盖了超过4.8万个频道中的17.35万个视频。这些数据不仅包括视频博主上传的字幕,还有YouTube自动生成的转录文本,语言种类丰富,包括英语、日语、德语和阿拉伯语等。

值得注意的是,这些数据并非由科技公司直接从YouTube上抓取,而是来源于一个名为Eleuther AI的非营利组织。Eleuther AI下载并整合了这些字幕文件,作为其发布的“大数据集”——「The Pile」的一部分。尽管Eleuther AI的初衷可能是为小型开发者和学者提供训练材料,但其行为实际上违反了YouTube禁止未经许可抓取内容的规定。

此事件引发了关于数据使用方面的相关讨论,例如内容创作者的版权和隐私权保护、数据共享与开放获取等。

盘古智库高级研究员江瀚向中华网财经指出,首先,这一事件暴露了人工智能行业在数据合规方面的几个关键漏洞:一是数据来源的合法性验证不足,企业可能过于追求数据的丰富性和多样性,而忽视了数据获取的合法性和授权问题;二是数据使用规范的缺失,即便企业获取了合法数据,但在使用过程中也可能存在超出授权范围或未经许可的用途变更;三是隐私保护机制的不足,未能充分保护数据主体的隐私权,尤其是在处理涉及个人信息的敏感数据时。

就科技公司而言,苹果、英伟达等作为事件的主要参与者,虽然并未直接参与数据的非法获取,但其使用这些数据的行为,也暴露了在数据来源审核和合规性方面的不足。

因此,江瀚认为,科技公司应建立严格的数据审核机制,明确数据审核的标准和流程,确保所有用于AI训练的数据都经过严格的筛选和验证。这包括对数据来源的合法性、数据内容的准确性、数据质量的可靠性等方面进行全面审查;其次,科技公司应加强与数据提供方的沟通与合作,确保在获取数据前明确数据使用的目的、范围、期限等,并获取必要的授权。同时,在数据使用过程中,应定期与数据提供方进行沟通和确认,确保数据使用的合规性;此外,科技公司应引入先进的数据审核技术和工具,如自然语言处理、机器学习等技术,辅助人工审核,提高数据审核的效率和准确性,同时加强对数据审核人员的培训和管理,提高他们的数据合规意识和审核能力;最后,科技公司应建立数据合规的监督和问责机制,对违反数据合规规定的行为进行严肃处理,并公开透明地披露数据合规情况,接受社会监督。通过不断完善数据审核流程和管理机制,科技公司可以确保未来使用的AI训练数据符合法律法规要求,为人工智能行业的健康发展贡献力量。

那么,在AI技术发展迅速的当下,企业如何平衡数据的开放性和个人隐私权的保护?江瀚建议:“一是加强数据合规意识,建立健全的数据合规管理体系,明确数据获取、使用、存储和销毁的全流程规范;二是加强数据隐私保护,采用加密技术、匿名化处理等手段,确保个人数据在传输、存储和使用过程中的安全性;三是推动数据共享与合作的合规化,与数据提供方明确数据使用的目的、范围、期限等,并获取必要的授权;四是加强技术创新,研发更加高效、精准的数据处理和分析技术,减少对数据量的过度依赖,降低数据合规风险。”

文章来源于网络。发布者:至诚财经网,转转请注明出处:https://www.nbdtoutiao.com/2024/07/18/4458.html

(0)
至诚财经网的头像至诚财经网
上一篇 2024 年 7 月 18 日 上午2:33
下一篇 2024 年 7 月 18 日 上午2:34

相关推荐

  • 非遗苗绣登陆伦敦时装周,京东服饰带中国原创品牌走向世界舞台

    近日,京东服饰与英国时装协会(British Fashion Council)达成战略合作,成为伦敦时装周亚洲官方线上零售合作伙伴。9月15日,京东服饰再次登陆国际时尚舞台,携手HAZZYS哈吉斯、Ellassay歌力思、Marisfrolg玛丝菲尔、Pure Tea茶愫等知名品牌登上伦敦时装周,并邀请郝允祥、谢欣、李振等国际超模担任开闭幕模特。同时,基于 …

    2024 年 9 月 18 日
    00
  • 贾跃亭喜提2.1亿,没有一笔融资是一份PPT搞不定的

    大洋彼岸的贾跃亭又拿到新融资了! 没有一轮融资是一条三寸不烂之舌和一份PPT搞不定的! 这次他又拿到了3000万美金,大概2.1亿元的新一轮融资。 险遭退市的FF再次合规上市,股价也应声大涨。这可把贾跃亭笑弯了腰。 这次又是拿着什么由头去忽悠资本的呢? 当然是什么最热,蹭什么了!这次,贾跃亭把他的FF套上了AI和EV的概念。 我去了解了一下啊,这次被忽悠的金…

    2024 年 9 月 20 日
    00
  • 车企价格战史无前例,首先防止低于成本价“恶性竞争”!

    7月30日,中央政治局召开会议,分析研究当前经济形势,部署下半年经济工作。会议指出,要强化行业自律,防止“内卷式”恶性竞争;要强化市场优胜劣汰机制,畅通落后低效产能退出渠道。 防止“内卷式”恶性竞争,汽车行业很快自觉“代入”。 价格战持续一年之久,并没有停息的意思,而围绕“卷不卷”,车企间的分歧越来越大。 连日来,围绕理想汽车销量周榜,蔚来和吉利高管公开反对…

    2024 年 8 月 1 日
    00
  • 65岁打工人开心?颤巍巍下楼还能再肝?上汽大通营销翻车!|飞灵

    又菜又爱玩。想玩个梗,没想直接翻车了。8月1日,上汽大通在7月29日的一条文案为“65岁,打工人,开心。有大家9超混,我超能混到65岁退休”的微博营销文案火了,直接被网友群殴了一顿,吓得官方赶紧删博。 在上汽大通这条微博中提到的“大家9超混”,是上汽大通在6月份推出的一款插混MPV车型,售价26.99万元-34.99万元。为了宣传这款车型,上汽大通借用近期讨…

    2024 年 8 月 2 日
    00
  • 华为变贵,苹果变慢

    消费电子巨头“对撞”,今年的科技春晚看点十足,火药味更甚。与科技新品一同而至的,是热度十足的默契“对撞”背后,另一路“拼抢与厮杀”。9月10日,华为Mate XT非凡大师三折叠手机正式亮相,大屏、轻薄无疑是最大亮点。该款手机展开后屏幕达到10.2英寸,而厚度仅为3.6毫米,可以说是把平板电脑装进口袋。而同天发布的iPhone 16系列,与之相比显得乏善可陈,…

    2024 年 9 月 12 日
    00

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信