#关于ai — Public Fediverse posts
Live and recent posts from across the Fediverse tagged #关于ai, aggregated by home.social.
-
@ccandyuki
这个…感觉可以展开讨论一下
首先关于生成式ai胡编乱造(#AI幻觉)的问题是根本性无解的,因为对于大模型来说「从已有素材中整理出一个回答」和「凭空捏造出一段材料」是完全一样的技术过程不过也有很多ai模型非常注重给出可靠引文,比如最早这样做的new bing ai会将每句话的材料出处链接给出,用户可直接点击访问;新兴的 #AI搜索引擎 如 #felo 和 #perplexity 也都会将信息的出处来源网页链接直接呈现给用户,以便用户进行溯源和核验。虽然这并不能从根本上解决ai幻觉的问题(again这对大模型来说是技术性无解的,它完全可能从一堆食谱页面链接中莫名其妙给出一句「母乳喂养好」),但对于普通用户使用ai进行信息检索已经非常有帮助
说起来我并不觉得随便转截图以及按自己理解转述信息并且不给出直达来源链接的人类会比生成式ai可靠多少,且看默嘟象上截图转嘟多普遍而带链接嘟文多稀有就可见一斑
而且人类不会像ai那样被指出问题后马上道歉和尝试改正,我在 #补个来源 时经常被截图者骂/拉黑… -
@ccandyuki
这个…感觉可以展开讨论一下
首先关于生成式ai胡编乱造(#AI幻觉)的问题是根本性无解的,因为对于大模型来说「从已有素材中整理出一个回答」和「凭空捏造出一段材料」是完全一样的技术过程不过也有很多ai模型非常注重给出可靠引文,比如最早这样做的new bing ai会将每句话的材料出处链接给出,用户可直接点击访问;新兴的 #AI搜索引擎 如 #felo 和 #perplexity 也都会将信息的出处来源网页链接直接呈现给用户,以便用户进行溯源和核验。虽然这并不能从根本上解决ai幻觉的问题(again这对大模型来说是技术性无解的,它完全可能从一堆食谱页面链接中莫名其妙给出一句「母乳喂养好」),但对于普通用户使用ai进行信息检索已经非常有帮助
说起来我并不觉得随便转截图以及按自己理解转述信息并且不给出直达来源链接的人类会比生成式ai可靠多少,且看默嘟象上截图转嘟多普遍而带链接嘟文多稀有就可见一斑
而且人类不会像ai那样被指出问题后马上道歉和尝试改正,我在 #补个来源 时经常被截图者骂/拉黑… -
@ccandyuki
这个…感觉可以展开讨论一下
首先关于生成式ai胡编乱造(#AI幻觉)的问题是根本性无解的,因为对于大模型来说「从已有素材中整理出一个回答」和「凭空捏造出一段材料」是完全一样的技术过程不过也有很多ai模型非常注重给出可靠引文,比如最早这样做的new bing ai会将每句话的材料出处链接给出,用户可直接点击访问;新兴的 #AI搜索引擎 如 #felo 和 #perplexity 也都会将信息的出处来源网页链接直接呈现给用户,以便用户进行溯源和核验。虽然这并不能从根本上解决ai幻觉的问题(again这对大模型来说是技术性无解的,它完全可能从一堆食谱页面链接中莫名其妙给出一句「母乳喂养好」),但对于普通用户使用ai进行信息检索已经非常有帮助
说起来我并不觉得随便转截图以及按自己理解转述信息并且不给出直达来源链接的人类会比生成式ai可靠多少,且看默嘟象上截图转嘟多普遍而带链接嘟文多稀有就可见一斑
而且人类不会像ai那样被指出问题后马上道歉和尝试改正,我在 #补个来源 时经常被截图者骂/拉黑… -
@ccandyuki
这个…感觉可以展开讨论一下
首先关于生成式ai胡编乱造(#AI幻觉)的问题是根本性无解的,因为对于大模型来说「从已有素材中整理出一个回答」和「凭空捏造出一段材料」是完全一样的技术过程不过也有很多ai模型非常注重给出可靠引文,比如最早这样做的new bing ai会将每句话的材料出处链接给出,用户可直接点击访问;新兴的 #AI搜索引擎 如 #felo 和 #perplexity 也都会将信息的出处来源网页链接直接呈现给用户,以便用户进行溯源和核验。虽然这并不能从根本上解决ai幻觉的问题(again这对大模型来说是技术性无解的,它完全可能从一堆食谱页面链接中莫名其妙给出一句「母乳喂养好」),但对于普通用户使用ai进行信息检索已经非常有帮助
说起来我并不觉得随便转截图以及按自己理解转述信息并且不给出直达来源链接的人类会比生成式ai可靠多少,且看默嘟象上截图转嘟多普遍而带链接嘟文多稀有就可见一斑
而且人类不会像ai那样被指出问题后马上道歉和尝试改正,我在 #补个来源 时经常被截图者骂/拉黑… -
音乐创作者#官大为 讨论AI创作对音乐人职业生涯影响的影片:
https://www.youtube.com/watch?v=KdNl-ow-E1U他的观点我差不多都认同,因为这和五年前(2019年)我在金融行业时听到的相关论述是高度吻合的;彼时用于内容生产的生成式AI还尚在襁褓,业界对AI技术的应用方向处于专案式业务辅助上(与今天的通用型人工智能AGI不同的方向)。
对于#新卢德主义 者所持的AI导致技术中心化这一点官大为没有提及,但我觉得他的例子已经无声地回应了这一点——留声机本体虽然进入个体手中,但赖以「发声」的唱片灌制发行相比传统乐队演奏是加剧中心化的;mp3格式虽然让人人都能手握音乐文档,但音频数据的编码和解码离开被巨头掌握的软件和硬件完全是黄粱一梦。
我们固然要关注作为AI技术根基的巨大能源和算力消耗导致的权力集约化,但似乎并没有看到新卢德主义者讨论AI在训练阶段与使用阶段的巨大能耗算力差异(训练AI模型必须依赖大规模服务器集群,但使用已经训练好的AI模型则可以跑在工作站上;经过精简的小AI模型甚至可以完全由内置NPU单元的移动Soc驱动)。 -
音乐创作者#官大为 讨论AI创作对音乐人职业生涯影响的影片:
https://www.youtube.com/watch?v=KdNl-ow-E1U他的观点我差不多都认同,因为这和五年前(2019年)我在金融行业时听到的相关论述是高度吻合的;彼时用于内容生产的生成式AI还尚在襁褓,业界对AI技术的应用方向处于专案式业务辅助上(与今天的通用型人工智能AGI不同的方向)。
对于#新卢德主义 者所持的AI导致技术中心化这一点官大为没有提及,但我觉得他的例子已经无声地回应了这一点——留声机本体虽然进入个体手中,但赖以「发声」的唱片灌制发行相比传统乐队演奏是加剧中心化的;mp3格式虽然让人人都能手握音乐文档,但音频数据的编码和解码离开被巨头掌握的软件和硬件完全是黄粱一梦。
我们固然要关注作为AI技术根基的巨大能源和算力消耗导致的权力集约化,但似乎并没有看到新卢德主义者讨论AI在训练阶段与使用阶段的巨大能耗算力差异(训练AI模型必须依赖大规模服务器集群,但使用已经训练好的AI模型则可以跑在工作站上;经过精简的小AI模型甚至可以完全由内置NPU单元的移动Soc驱动)。 -
音乐创作者#官大为 讨论AI创作对音乐人职业生涯影响的影片:
https://www.youtube.com/watch?v=KdNl-ow-E1U他的观点我差不多都认同,因为这和五年前(2019年)我在金融行业时听到的相关论述是高度吻合的;彼时用于内容生产的生成式AI还尚在襁褓,业界对AI技术的应用方向处于专案式业务辅助上(与今天的通用型人工智能AGI不同的方向)。
对于#新卢德主义 者所持的AI导致技术中心化这一点官大为没有提及,但我觉得他的例子已经无声地回应了这一点——留声机本体虽然进入个体手中,但赖以「发声」的唱片灌制发行相比传统乐队演奏是加剧中心化的;mp3格式虽然让人人都能手握音乐文档,但音频数据的编码和解码离开被巨头掌握的软件和硬件完全是黄粱一梦。
我们固然要关注作为AI技术根基的巨大能源和算力消耗导致的权力集约化,但似乎并没有看到新卢德主义者讨论AI在训练阶段与使用阶段的巨大能耗算力差异(训练AI模型必须依赖大规模服务器集群,但使用已经训练好的AI模型则可以跑在工作站上;经过精简的小AI模型甚至可以完全由内置NPU单元的移动Soc驱动)。 -
音乐创作者#官大为 讨论AI创作对音乐人职业生涯影响的影片:
https://www.youtube.com/watch?v=KdNl-ow-E1U他的观点我差不多都认同,因为这和五年前(2019年)我在金融行业时听到的相关论述是高度吻合的;彼时用于内容生产的生成式AI还尚在襁褓,业界对AI技术的应用方向处于专案式业务辅助上(与今天的通用型人工智能AGI不同的方向)。
对于#新卢德主义 者所持的AI导致技术中心化这一点官大为没有提及,但我觉得他的例子已经无声地回应了这一点——留声机本体虽然进入个体手中,但赖以「发声」的唱片灌制发行相比传统乐队演奏是加剧中心化的;mp3格式虽然让人人都能手握音乐文档,但音频数据的编码和解码离开被巨头掌握的软件和硬件完全是黄粱一梦。
我们固然要关注作为AI技术根基的巨大能源和算力消耗导致的权力集约化,但似乎并没有看到新卢德主义者讨论AI在训练阶段与使用阶段的巨大能耗算力差异(训练AI模型必须依赖大规模服务器集群,但使用已经训练好的AI模型则可以跑在工作站上;经过精简的小AI模型甚至可以完全由内置NPU单元的移动Soc驱动)。 -
想起了纪录片《#中国梵高》里产业化生产临摹油画的#大芬村 和主角#赵小勇 ,人类在流水线上被异化成一块零件,字面意义上地机械执行着指定动作。生产一副油画的过程,和生产一台汽车的流水线别无二致。
https://www.mplus.org.hk/tc/cinema/makers-and-making/chinas-van-goghs/此外还有电影《#至爱梵高》(#LovingVincent ),画面是演员实拍然后由125名画师对照手绘,共六万五千帧。
https://letterboxd.com/film/loving-vincent/今时今日,梵高已经变成了摄像apps的滤镜名称,对油画一无所知的用户只需一键就可将生成。让工人临摹画作的一笔,让画师比照电影抽帧绘制图画,和让机器和算法依照学习到的画风修改照片,我们应该如何去分析三者在异化人格、体现人类创造性上的微妙区别?
-
#deepfake 应当被加以法律制约(尤其它主要被用于制造虚假色情影像);但#深伪技术 应当被允许使用、特别是让每一位公民使用,也正是因为#匿名权 和#隐私权 是每一个人都应当拥有的权力。
每一项用于为「取缔deepfake技术」辩护的理由,都可以直接应用于为#实名制 辩护,而那样的现实何如我们早已经亲自体会了。
从这衍生出另一个议题——
技术的发展和普及是必然的,当技术发展普及的后果降临社会,我们要做的不是寄望于#公权力 对其进行约束限制,而是承担起我们作为公民、作为社会组成分子的责任,积极地参与到对话中、并且拉动更多人也参与到对话中,以共识地形式建立新的社会秩序。当你觉得PRC全面禁枪、禁止管制刀具是「保护了你的安全」,那你是否忽略了这其中隐藏的阶级(经济环境对治安水平的影响)、性别(女性和性多元群体人身安全)、种族(少数民族人权)议题呢?
-
https://g0v.social/@nope030/109993222923095746
…传这种假新闻然后轻描淡写地编辑上「与AI无关」这种完全改变事件价值判断的说明
真的恶心
反对AI到造谣传谣的路数也真是够了
之前还看到有人忧心忡忡「AI会让假新闻泛滥加剧」
没有好的信息摄入与信息传播习惯(不要信赖截图、注意署名、引用带好出处链接),有没有AI都一样是深陷虚假消息的泥沼里 -
误解三:「#ChatGPT 解决不了来源准确性和新闻即时性的问题,这是#大语言模型 的硬伤。」
大语言模型本身如何保证「正确」是一个复杂的问题。但在普通人的应用角度,这件事可以非常轻易地从工程上绕过去。今天 #Bing 的试用已经逐步铺开了(见附图),附图里是关于2023年的时事的提问(而众所周知 ChatGPT 的训练语料完全来自2021年之前),你会看到它的回答非常准确,而且每句话都附上了#来源链接。这是因为 ChatGPT 或类似的大语言模型并不应该被理解为一个从零开始的静态知识库,而是一个可以动态附着在其他信息源上的 layer(「作为一种服务的自然语言界面」)。因此,哪怕用最笨的方式,搜索引擎至少可以当场把传统的搜索结果喂给它,它再以一种对话的方式把它呈现出来,而这就间接解决了准确性和即时性的问题(至少不差于传统#搜索引擎)。
https://weibo.com/1644684112/Msk5YyYbb -
↑
#关于AI
这里callback一下昨天谈到的关于考试务实与务虚的问题,AI就像一台高度提纯的考试机器,它对现实知识一无所知,但有很强的「通过题干命中正确答案」的能力。这同时就解决了两个议题:a. 纯粹化、抽象化的考试是没有任何意义的 b. 人以外的东西进行考试是没有任何意义的。我也想回应一下#新卢德主义 关于AI带来的伦理问题。实际上,能更早发现AI种种缺陷和问题的往往是AI的支持者,因为祂们拥有足够的技术能力去发现问题、理解根源,并且提出解决方案。比如用于填充图像分辨率的PULSE模型倾向于将非白人面孔填充为白人面孔 https://www.theverge.com/21298762/face-depixelizer-ai-machine-learning-tool-pulse-stylegan-obama-bias ;以及推特裁切缩略图时的年龄/种族偏见 https://www.theverge.com/2021/8/10/22617972/twitter-photo-cropping-algorithm-ai-bias-bug-bounty-results,都是现在技术社区内被发现、然后扩散传播成为社会事件的。
与此同时,技术的问题也不光只能通过技术手段解决,因为任何技术都要依附于现实世界存在。比如前几天突然又在象上被转起来的图片伪造犯罪问题,实际不仅早已有了专门的名称#深伪技术 #deepfake,社会各界早已展开行动:技术上各种深伪检测算法的诞生;媒体上……
↓ -
↑
#关于AI
这里callback一下昨天谈到的关于考试务实与务虚的问题,AI就像一台高度提纯的考试机器,它对现实知识一无所知,但有很强的「通过题干命中正确答案」的能力。这同时就解决了两个议题:a. 纯粹化、抽象化的考试是没有任何意义的 b. 人以外的东西进行考试是没有任何意义的。我也想回应一下#新卢德主义 关于AI带来的伦理问题。实际上,能更早发现AI种种缺陷和问题的往往是AI的支持者,因为祂们拥有足够的技术能力去发现问题、理解根源,并且提出解决方案。比如用于填充图像分辨率的PULSE模型倾向于将非白人面孔填充为白人面孔 https://www.theverge.com/21298762/face-depixelizer-ai-machine-learning-tool-pulse-stylegan-obama-bias ;以及推特裁切缩略图时的年龄/种族偏见 https://www.theverge.com/2021/8/10/22617972/twitter-photo-cropping-algorithm-ai-bias-bug-bounty-results,都是现在技术社区内被发现、然后扩散传播成为社会事件的。
与此同时,技术的问题也不光只能通过技术手段解决,因为任何技术都要依附于现实世界存在。比如前几天突然又在象上被转起来的图片伪造犯罪问题,实际不仅早已有了专门的名称#深伪技术 #deepfake,社会各界早已展开行动:技术上各种深伪检测算法的诞生;媒体上……
↓ -
↑
#关于AI
这里callback一下昨天谈到的关于考试务实与务虚的问题,AI就像一台高度提纯的考试机器,它对现实知识一无所知,但有很强的「通过题干命中正确答案」的能力。这同时就解决了两个议题:a. 纯粹化、抽象化的考试是没有任何意义的 b. 人以外的东西进行考试是没有任何意义的。我也想回应一下#新卢德主义 关于AI带来的伦理问题。实际上,能更早发现AI种种缺陷和问题的往往是AI的支持者,因为祂们拥有足够的技术能力去发现问题、理解根源,并且提出解决方案。比如用于填充图像分辨率的PULSE模型倾向于将非白人面孔填充为白人面孔 https://www.theverge.com/21298762/face-depixelizer-ai-machine-learning-tool-pulse-stylegan-obama-bias ;以及推特裁切缩略图时的年龄/种族偏见 https://www.theverge.com/2021/8/10/22617972/twitter-photo-cropping-algorithm-ai-bias-bug-bounty-results,都是现在技术社区内被发现、然后扩散传播成为社会事件的。
与此同时,技术的问题也不光只能通过技术手段解决,因为任何技术都要依附于现实世界存在。比如前几天突然又在象上被转起来的图片伪造犯罪问题,实际不仅早已有了专门的名称#深伪技术 #deepfake,社会各界早已展开行动:技术上各种深伪检测算法的诞生;媒体上……
↓ -
从目前公开的情报来看,整合了#chatGPT 的#微软 #Microsoft #必应 #bing 搜索引擎在「对原作者/#版权 的尊重」上已经超过了九成九的丝国默嘟象用户,因为它会清晰直接地列出所提供信息的来源链接,而这是目前汉语联邦网络上绝大部分人都做不到的。
https://mastodon.world/@joannastern/109825729497466444
(当然搜索引擎本身对信息的索引涉及到「合理引用」以及避风港原则等的影响,不作展开)我想就这个话题补充一些信息,因为我发现大部分对#AI 技术的反对者对于它的基本原理是有严重误解的,这影响了祂们观点的准确性。
比如最基础的,AI的反对者普遍会将算法「#人格化」和「#主体化」,反而是AI的支持者可以更好地以「#工具化」「#客体化」的视角审视这类技术。我很高兴看到#新卢德主义 开始出现在话题中,这对于我们梳理#人工智能伦理 有很大帮助。
#关于AI预先说明:因为我并非技术背景出身,以下嘟文存在着#过度简化 的问题,有任何反驳和补充欢迎加入讨论。
让我们开始吧—— -
从目前公开的情报来看,整合了#chatGPT 的#微软 #Microsoft #必应 #bing 搜索引擎在「对原作者/#版权 的尊重」上已经超过了九成九的丝国默嘟象用户,因为它会清晰直接地列出所提供信息的来源链接,而这是目前汉语联邦网络上绝大部分人都做不到的。
https://mastodon.world/@joannastern/109825729497466444
(当然搜索引擎本身对信息的索引涉及到「合理引用」以及避风港原则等的影响,不作展开)我想就这个话题补充一些信息,因为我发现大部分对#AI 技术的反对者对于它的基本原理是有严重误解的,这影响了祂们观点的准确性。
比如最基础的,AI的反对者普遍会将算法「#人格化」和「#主体化」,反而是AI的支持者可以更好地以「#工具化」「#客体化」的视角审视这类技术。我很高兴看到#新卢德主义 开始出现在话题中,这对于我们梳理#人工智能伦理 有很大帮助。
#关于AI预先说明:因为我并非技术背景出身,以下嘟文存在着#过度简化 的问题,有任何反驳和补充欢迎加入讨论。
让我们开始吧—— -
从目前公开的情报来看,整合了#chatGPT 的#微软 #Microsoft #必应 #bing 搜索引擎在「对原作者/#版权 的尊重」上已经超过了九成九的丝国默嘟象用户,因为它会清晰直接地列出所提供信息的来源链接,而这是目前汉语联邦网络上绝大部分人都做不到的。
https://mastodon.world/@joannastern/109825729497466444
(当然搜索引擎本身对信息的索引涉及到「合理引用」以及避风港原则等的影响,不作展开)我想就这个话题补充一些信息,因为我发现大部分对#AI 技术的反对者对于它的基本原理是有严重误解的,这影响了祂们观点的准确性。
比如最基础的,AI的反对者普遍会将算法「#人格化」和「#主体化」,反而是AI的支持者可以更好地以「#工具化」「#客体化」的视角审视这类技术。我很高兴看到#新卢德主义 开始出现在话题中,这对于我们梳理#人工智能伦理 有很大帮助。
#关于AI预先说明:因为我并非技术背景出身,以下嘟文存在着#过度简化 的问题,有任何反驳和补充欢迎加入讨论。
让我们开始吧—— -
还有,#截图 不具备被检索的可能。对于事件后续跟踪和反思,检索各类信息进行整合是很关键的一步。
无法被检索就意味着无法被记住,只会不断被遗忘。
公共存档服务的检索还很孱弱,但至少可用;telegraph受限于telegram的数据库结构和产品策略,不仅对外部搜索封闭不开放,它自身的搜索功能也完全残废;截图则完全不可能,在目前完全基于字节构建的互联网上,图片、音频和视频这类富媒体是几乎不存在主动的二次消费的,这也是受众越来越依赖平台、依赖推荐算法喂养的原因。
想想看,你想到一个词、一句话、一个画面元素等,想要找到之前看到它时承载它的图片、音频(比如播客)和视频(比如各类教程),找到它们要花多少力气?
即使是#推荐算法,在建立内容相似性关系时也无法直接处理富媒体内容,要通过降格转换(ocr、stt等技术将富媒体承载的信息转为文本,再索引转换后文本)、meta信息(富媒体发布时的尺寸、hash等属性,以及用户附加的标签、字幕、附言、标题、评论等)以及用户行为(用户前后浏览行为上下文、好友看过等社交关系etc)来实现。
也许这一切在#机器学习 和深度神经网络算法普及后会变吧。
#关于AI