哈佛首先引进了这个机构国家数据倡议(IDI)于2024年3月发布。这是一个计划,为大学创建一个值得信赖的公司为人工智能提供法律数据。最后,随着它的正式发布,我们了解到微软和OpenAI是支持IDI的巨头。现在,谷歌还与哈佛大学的谷歌图书平台合作,帮助训练人工智能。
网上大约有100万本公共领域的图书。公共领域的书籍不受版权法的保护。任何人都可以使用这些书,包括它的材料、引文、文本等等。一切都不用担心。关于版权侵权。版权法主要不适用于这些书,因为它们年代久远。由于它们已经成为旧书和作者,版权法对这些书不适用,或者已经过期。
例如,但丁、狄更斯、莎士比亚和其他古代流行作家的作品都是免费的。这些游戏通常也可以在多个平台上使用,而无需担心布特版权。现在,这些书被哈佛大学和b谷歌合作编译成人工智能训练数据集。虽然数据集尚未发布,但它将使用谷歌的图书扫描项目谷歌Books。
这将是一个丰富的数据集,尤其是知识、个性、经验、信息等方面的宝藏。这一切都意味着人工智能是一个大概不是。不仅要学习文学,还要学习人类的想象力是如何工作的。因为文学一直是一种艺术作为人类文明的重要组成部分,这很容易将人工智能推向更合法的领域。是我重要的是要明白,100万本书不是开玩笑。
这是一个巨大的数据集。考虑到在数据集上训练人工智能是昂贵的,这可以帮助公平竞争。所以如何?当人工智能需要数据集进行训练时,企业可能会雇佣co .内容写手、人工智能培训师、工程师等等。他们把信息提供给人工智能,让它来处理。工程师甚至创建数据集来帮助人工智能处理它。所有这一切耗费时间和资源。
现在你可能不知道为什么人工智能数据集不能在互联网上搜索。这是在哪儿版权法开始发挥作用。例如,各种发布平台之前已经禁止或禁用了ChatGPT等ai扫描他们的平台。这是违法的。
数据相当于100万本书,这就像丰富的人类知识和信息。所以,你可以期望任何人最终都能更快地训练人工智能。这也引出了这样做是否合乎道德的问题。它最终将帮助人工智能积累更多的知识,变得精通,但随之而来的危险是什么?我们公司不断探索人工智能的阴暗面。
我们知道,如果有版权法,这些作家和这些书仍然会受到法律的保护。可以说,人工智能公司是有限的不断寻找漏洞来训练他们的人工智能,并将任何东西都用作数据。这和我是怎么它以前使用公共职位来训练它的人工智能等等。这种不道德的做法继续挖掘新发现的漏洞。
告密者还是受害者?巴拉吉之死引发了令人担忧的问题
OpenAI会为了资金而让每个人都能使用AGI吗?道德问题
探索人工智能的阴暗面矛盾和伦理
https://techgig.com/generateHttpWebService-v2.php?tgtype=SAVE_NEWS_READ_LOGS&news_id=116398573&news_title=Harvard和谷歌合作通过版权漏洞向AI教授文学&news_sec=Technology&tags=AI训练数据集,公共领域书籍,机器学习和文学,文学和AI,机构
哈佛大学和谷歌人工智能合作伙伴关系,谷歌图书项目,人工智能的伦理影响,版权漏洞,人工智能数据训练,&news_url=https://content.techgig.com/technology/harvard-and-google-team-up-to-teach-literature-to-ai-through-copyright-loophole/articleshow/116398573.cms&ppuserinfo=




