home.social

#地點推測 — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #地點推測, aggregated by home.social.

  1. Watching o3 guess a photo’s location is surreal, dystopian and wildly entertaining

    Link
    Watching o3 guess a photo’s location is surreal, dystopian and wildly entertaining
    https://simonwillison.net/2025/Apr/26/o3-photo-location-guess/

    📌 Summary:
    本文介紹作者利用 OpenAI 最新的 o3 模型,透過輸入一張無明顯地標的照片,讓 AI 猜測拍攝地點的過程。雖然一開始模型表示無法「看見」圖片,但隨即啟動視覺分析功能,對照片中細節如房屋風格、植被種類、天氣與許多線索進行推理,甚至以 Python 程式碼裁切、放大車牌區域嘗試辨識。模型最終判斷地點為加州中部海岸區的 Cambria,但實際地點是約 200 英里北方的 El Granada,模型的第二猜測則完全正確。此過程彷彿科幻情節真實上演,過程既令人驚艷也帶有反烏託邦意味,提醒人們共享照片可能洩漏位置資訊,引發隱私疑慮。此外,作者也比較了其他模型如 Claude 3.7、Gemini 等的表現與功能差異,指出 o3 模型在「思考」階段持續調用工具(放大裁切、環境推理),展現人工智慧未來整合多模態工具的強大潛力。最後作者分享了自己在保證照片無 EXIF 資料後仍能順利猜出所在地的經驗,強調此技術的廣泛適用性與社會影響。

    🎯 Key Points:
    → 模型操作流程:將照片上傳到 ChatGPT o3(收費 Plus 方案),初步分析圖像內容,繼續裁切、放大細節區域用以偵測線索(例如車牌)。
    → 線索分析依據:居民區建築風格、植被種類(橄欖樹、加州罌粟花)、天氣狀況、建築顏色和設計、海岸地形及丘陵背景,綜合推斷為加州中部海岸小鎮。
    → 精細推理過程:模型執行多次裁切放大操作,並用 Python 代碼輔助分析,類似專家對案件逐步排查,兼具娛樂與科幻色彩。
    → 結果反饋:最終猜測 Cambria 與正式地點 El Granada 相距約 200 英里,但第二個猜測(El Granada)完全命中,且推理過程沒有作弊使用 EXIF。
    → 其他模型比較:Claude 3.7 也能推測大致區域但無法像 o3 一樣細緻放大;Gemini 版本則有使用位置資訊作弊問題。
    → 技術與社會影響:技術成熟且公開易用,提醒使用者分享照片時要注意隱私安全,任何看似平凡的照片都可能被定位。
    → o3 模型具備粗略位置存取權限,但透過剝離 EXIF 仍能依據畫面內容推理出拍照地點,且多位用戶檢驗證實此功能準確。
    → 模型思考與工具整合示範:o3 在回答過程中持續使用外部工具,展現未來 AI 複合推理模式的重要樣板。

    🔖 Keywords:
    #OpenAI_o3 #地點推測 #多模態_人工智慧 #加州中部海岸 #隱私安全