#大數據分析 — Public Fediverse posts
Live and recent posts from across the Fediverse tagged #大數據分析, aggregated by home.social.
-
Your phone isn't secretly listening to you, but the truth is more disturbing | Hacker News
Link
你的手機真的會偷聽嗎?真相更加令人不安
https://newatlas.com/computers/smartphone-listening-conversations-ads-facebook/
📌 Summary:
本文探討了長久以來流傳的智慧型手機偷聽私密談話以投放精準廣告的陰謀論,並以多項實驗與調查結果分析其真偽。儘管不少使用者曾有過談話後立即看到相關廣告的經驗,但迄今並無具體證據證明智慧型手機會持續開啟麥克風監聽。2019 年手機資安公司 Wandera 透過測試發現,常駐背景監聽會產生顯著的數據使用和電力耗損,但實際數據並未顯示手機存在此現象。此外,Facebook 曾聘請外包員工以人工方式檢視用戶 Messenger 的語音轉錄資料,但這是經用戶同意且為提升語音辨識服務所為,並非無差別偷聽。而 2024 年媒體爆出 Cox Media Group 曾開發所謂的 Active Listening 廣告系統,但該系統並非全時監聽,而是利用語音助理啟動後錄取的短暫語音數據,且已遭相關公司否認合作並停用。反而有研究指出,手機和應用程式透過截圖、螢幕錄影等方式,監控用戶行為並傳送第三方,成為比偷聽更嚴重的隱私威脅。本文強調,廣告商能精準投放廣告,乃是因為龐大且複雜的數據分析和多元行為追蹤,而非簡單的麥克風竊聽。智慧型手機的隱私風險 更深刻且多元,遠超出單純偷聽的假說。
🎯 Key Points:
★ 陰謀論與事實調查→ 智慧型手機持續透過麥克風偷聽無確證,多數「疑似偷聽」案例是誤解或巧合。
★ Wandera 2019 年實驗→ 讓手機暴露於重複播放特定聲音廣告,卻未發現對應廣告投放或數據消耗異常,排除全時監聽可能。
★ Facebook 人工轉錄→ 2019 年爆出 Facebook 聘外包聽寫 Messenger 語音內容,此為提升語音辨識準確率,用戶須同意參與,但非用於監聽與廣告。
★ Cox Media Group Active Listening 系統→ 2024 年爆料稱其可利用麥克風錄取「即時意圖資料」,結合 AI 與行為數據以投放精準廣告,但無持續偷聽,且官方迅速否認與之合作,並停止產品。
★ 螢幕截圖與錄影問題→ 研究發現超過 9,000 款 Android App 具截圖能力,部分 App 未告知用戶即傳送螢幕畫面給第三方,隱私泄露可能超越麥克風監控。
★ 複雜大數據運算→ 廣告商透過跨裝置追蹤、位置資訊、通訊錄、瀏覽行為與社交網絡關係,結合機器學習分析,能預測用戶需求,營造「偷聽感」。
★ 手機麥克風監聽技術的限制→ 持續監聽會造成明顯的電池消耗與數據流量,且智慧型裝置多採低功耗語音喚醒元件,非全時錄音。
★ 使用者隱私防護建議→ 清楚手機與 App 的權限,謹慎授權,並注意其他可疑監控方式(如截圖);智慧型裝置(如智慧電視)可能有較高監聽風險。
★ 陰謀論的心理原因→ 由於廣告準確度有時驚人,民眾更易相信偷聽陰謀,缺乏對複雜數據生態的瞭解,是誤解來源。
🔖 Keywords:
#智慧型手機 #麥克風監聽 #隱私侵犯 #精準廣告 #大數據分析 -
@raj_raj88則回覆GPT是語言文字模型,不是數學模型。在此之前,3月份Wolfram Alpha - 一家以數學運算軟體的公司 - 和OpenAI 合作,推出chatGPT插件,意即chatGPT可以將對話中需要做數學運算的部分,以API方式傳到Wolfram Alpha,運算出正確的數學或算數結果後,再回傳給使用者。[註3]
相比於兩者的結合,台灣的人工智慧技術在數字分析上已經大體完成,並可通過數字模擬與變數轉換技術達到更多的數字模型的建構與驗證。與此同時,台灣因人工智慧技術也已經驗證統計學中重要的中央極限定理,發現其中更多的影響因子,同時間,此人工智慧技術軟體也被釋出,提供高中生、學生族群或其他對此有興趣使用。
註3: https://hub.baai.ac.cn/view/25031
#AI #人工智慧 #人工智能 #大數據 #大數據分析 #bigdata #統計學 #機率論 #統計 #機率 #程式設計 #程式 #數學 #GPT #生成式AI #台灣 #臺灣 #投資筆記
-
台灣目前已經將 AlphaGo 技術(貝氏決策分析)應用在「德州撲克」牌局勝率計算中,並完整公開在YouTube,計三集[註1]。
台灣人工智慧產業鏈中,除了跟隨國際主流的生成式AI應用外,同時也較美國知名大學Dimakis教授在今年8月推文所提到Ye-Jin Choi教授給的GPT-4弱點可表現在三位數相乘,以237*757為例,GPT4會給出179289的錯誤數字,並且準確率只達59%。4位數相乘的準確率只有4%,而五位數相乘則是0%[註2]。
註1: https://youtu.be/8B8QA9-iOXg
註2: https://x.com/AlexGDimakis/status/1691600985938858432?s=20#AlphaGO #貝氏決策 #德州撲克 #AI #人工智慧 #人工智能 #大數據 #大數據分析 #bigdata #統計學 #機率論 #統計 #機率 #程式設計 #程式 #數學 #GPT #生成式AI #台灣 #臺灣 #投資筆記
-
台灣目前已經將 AlphaGo 技術(貝氏決策分析)應用在「德州撲克」牌局勝率計算中,並完整公開在YouTube,計三集[註1]。
台灣人工智慧產業鏈中,除了跟隨國際主流的生成式AI應用外,同時也較美國知名大學Dimakis教授在今年8月推文所提到Ye-Jin Choi教授給的GPT-4弱點可表現在三位數相乘,以237*757為例,GPT4會給出179289的錯誤數字,並且準確率只達59%。4位數相乘的準確率只有4%,而五位數相乘則是0%[註2]。
註1: https://youtu.be/8B8QA9-iOXg
註2: https://x.com/AlexGDimakis/status/1691600985938858432?s=20#AlphaGO #貝氏決策 #德州撲克 #AI #人工智慧 #人工智能 #大數據 #大數據分析 #bigdata #統計學 #機率論 #統計 #機率 #程式設計 #程式 #數學 #GPT #生成式AI #台灣 #臺灣 #投資筆記
-
台灣目前已經將 AlphaGo 技術(貝氏決策分析)應用在「德州撲克」牌局勝率計算中,並完整公開在YouTube,計三集[註1]。
台灣人工智慧產業鏈中,除了跟隨國際主流的生成式AI應用外,同時也較美國知名大學Dimakis教授在今年8月推文所提到Ye-Jin Choi教授給的GPT-4弱點可表現在三位數相乘,以237*757為例,GPT4會給出179289的錯誤數字,並且準確率只達59%。4位數相乘的準確率只有4%,而五位數相乘則是0%[註2]。
註1: https://youtu.be/8B8QA9-iOXg
註2: https://x.com/AlexGDimakis/status/1691600985938858432?s=20#AlphaGO #貝氏決策 #德州撲克 #AI #人工智慧 #人工智能 #大數據 #大數據分析 #bigdata #統計學 #機率論 #統計 #機率 #程式設計 #程式 #數學 #GPT #生成式AI #台灣 #臺灣 #投資筆記
-
台灣目前已經將 AlphaGo 技術(貝氏決策分析)應用在「德州撲克」牌局勝率計算中,並完整公開在YouTube,計三集[註1]。
台灣人工智慧產業鏈中,除了跟隨國際主流的生成式AI應用外,同時也較美國知名大學Dimakis教授在今年8月推文所提到Ye-Jin Choi教授給的GPT-4弱點可表現在三位數相乘,以237*757為例,GPT4會給出179289的錯誤數字,並且準確率只達59%。4位數相乘的準確率只有4%,而五位數相乘則是0%[註2]。
註1: https://youtu.be/8B8QA9-iOXg
註2: https://x.com/AlexGDimakis/status/1691600985938858432?s=20#AlphaGO #貝氏決策 #德州撲克 #AI #人工智慧 #人工智能 #大數據 #大數據分析 #bigdata #統計學 #機率論 #統計 #機率 #程式設計 #程式 #數學 #GPT #生成式AI #台灣 #臺灣 #投資筆記
-
CW: 想選個人工智慧或數據分析之類的研習班?會人工智慧?問他一句:有寫出統計套裝軟體程式?拉出來看看吧!
#台灣 一堆的 #人工智慧 、 #大數據分析 、 #機器學習 、 #程式語言 班,如火如荼。你學會寫 #程式 嗎?你做得出人工智慧?怕不是機械操作晶片寫入的判斷動作指令?!
事實呢?光是那近十萬台幣,內容還有 python 指令和應用教學的班,幾乎可以才猜想出和過去「python和投資理財」掛勾時,講師直接說python已經寫好,學習者只要改代號就可以。
如果這些人真的如此厲害,有機會你可以問一句:那你怎麼沒寫出統計套裝軟體的程式?
如果對方用市面已經有,那你別相信他會寫人工智慧的程式。因為大概率是我前面說的套程式模組,改參數。這在大學教的,或項目專案,或研究,很常見。
你只要懂數據驅動的運算結果要出數學式,有線圖或直方圖也要對出數學式,就能知道是驢是馬。
所以當你選課或看到網上的這類課程/培訓班,減少用過去他們的名氣/聲望去選擇。真正走前緣,還是有人願意出來傳承真正的技術!
-
#大數據分析筆記
數據流程說明1. 定義問題
2. 搜集數據>第一點決定要搜集的數據有哪些,那麼搜集就得有搜集方法,包含來源、規則、儲存。
3. 處理數據
>包含清洗數據和優化數據,是目前數據科學的核心,也是有商業化的部份。
4. 分析數據
>分析數據的方法可以歸納為測定、建模、模擬、驗證、預測。這和目前網路公開的大數據分析內容不同,其中各種演算法是將上述的方法類別落實。
此處還要注意「數據特質」!例如分析數據的數據是常見可做四則運算的數字,就能適用實數系發展出來的數學和變數變換。
數字可能是排序用,不能做四則運算,那就要用另一種分析方法。
數據不是數字,就會落在「計數」,產生「頻率」的分析方法上。
5. 解讀數據