home.social

#text-mining — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #text-mining, aggregated by home.social.

fetched live
  1. Random Thoughts: Searchable comics text pages?. “After finding a collection of Marvel Bullpen Bulletins for the search engine for magazines about comics, I started to wonder whether it’d be useful (or fun) to include text pages from comics in general. I mean — editorials, letters pages, ‘hype pages’… There’s information there that’s not available anywhere else. So… perhaps? Maybe?”

    https://rbfirehose.com/2026/06/19/random-thoughts-searchable-comics-text-pages/
  2. Random Thoughts: Searchable comics text pages?. “After finding a collection of Marvel Bullpen Bulletins for the search engine for magazines about comics, I started to wonder whether it’d be useful (or fun) to include text pages from comics in general. I mean — editorials, letters pages, ‘hype pages’… There’s information there that’s not available anywhere else. So… perhaps? Maybe?”

    https://rbfirehose.com/2026/06/19/random-thoughts-searchable-comics-text-pages/
  3. Repenser l'histoire de la migration à l'ère du #numérique. Dans deux semaines, notre université d’été (en collaboration avec le #C2DH de Luxembourg) explorera la manière dont les #méthodesnumériques révolutionnent la #recherche sur les #migrations – du #textmining aux #SIG ⬇️

    📍 22.07-26.07. | IHA
    🔤 fr/en

    #DigitalHumanities #DigitalHistory #histoirenumérique #DH #Migrationsgeschichte #Migrationhistory #summeruniversity
    dhi-paris.fr/fr/agenda-detaill

  4. Repenser l'histoire de la migration à l'ère du #numérique. Dans deux semaines, notre université d’été (en collaboration avec le #C2DH de Luxembourg) explorera la manière dont les #méthodesnumériques révolutionnent la #recherche sur les #migrations – du #textmining aux #SIG ⬇️

    📍 22.07-26.07. | IHA
    🔤 fr/en

    #DigitalHumanities #DigitalHistory #histoirenumérique #DH #Migrationsgeschichte #Migrationhistory #summeruniversity
    dhi-paris.fr/fr/agenda-detaill

  5. 🚀 Accéder à TDM Factory est désormais encore plus simple grâce à l’authentification via la fédération d’identité Renater.

    Testez les 22 web services de fouille de textes sur vos propres données 👇
    tdm-factory.services.istex.fr/

    #TDMFactory #ISTEX #Renater #TextMining #ESR #ScienceOuverte

  6. 🚀 Accéder à TDM Factory est désormais encore plus simple grâce à l’authentification via la fédération d’identité Renater.

    Testez les 22 web services de fouille de textes sur vos propres données 👇
    tdm-factory.services.istex.fr/

    #TDMFactory #ISTEX #Renater #TextMining #ESR #ScienceOuverte

  7. 📺 Recording now available!

    Missed our recent R-Ladies Rome workshop on Text Analysis in R: From tidytext to Local LLMs?

    In this session, Dariia Mykhailyshyna walks through a complete text analysis workflow in R

    Watch the recording 🎥 youtu.be/b8WhdKCkdEo

  8. 📺 Recording now available!

    Missed our recent R-Ladies Rome workshop on Text Analysis in R: From tidytext to Local LLMs?

    In this session, Dariia Mykhailyshyna walks through a complete text analysis workflow in R

    Watch the recording 🎥 youtu.be/b8WhdKCkdEo
    #RLadiesRome #rstats #NLP #TextMining #DataScience #AI #LLM #Ollama

  9. 🔎 Envie de découvrir le Text & Data Mining sans être expert en informatique ?

    Participez au webinaire « Découverte de TDM Factory »

    Au programme : démonstration de l’interface, cas d’usage et échanges autour des possibilités offertes par la fouille de textes et de données pour analyser vos corpus, extraire des concepts ou repérer des tendances.

    📅 demain, 20 mai 2026 — 11h à 12h

    👉 En savoir plus : inist.fr/services/former/webin

    #Webinaire #TextMining #DataMining #FouilleDeTextes

  10. 🔎 Envie de découvrir le Text & Data Mining sans être expert en informatique ?

    Participez au webinaire « Découverte de TDM Factory »

    Au programme : démonstration de l’interface, cas d’usage et échanges autour des possibilités offertes par la fouille de textes et de données pour analyser vos corpus, extraire des concepts ou repérer des tendances.

    📅 demain, 20 mai 2026 — 11h à 12h

    👉 En savoir plus : inist.fr/services/former/webin

    #Webinaire #TextMining #DataMining #FouilleDeTextes

  11. 📣Der Märzvortrag unseres #DHELab nächste Woche am

    📅 Fr, 27.3.2026 | 12-13 Uhr | Online

    Mit Max Zeterberg (@subugoe) & Lasse Clausen (@unigoettingen) widmet sich der #DigitaleEdition des #Pädagogen Klaus Mollenhauer, ihrer Entstehung und den Nutzungsmöglichkeiten:
    ➡️ bbf.dipf.de/de/aktuell/termine

    #histed #textmining #datamining #DigitalHistory #DH #OpenData #FDM #history #histodons #OpenAccess @dipf_aktuell

  12. 📣Der Märzvortrag unseres #DHELab nächste Woche am

    📅 Fr, 27.3.2026 | 12-13 Uhr | Online

    Mit Max Zeterberg (@subugoe) & Lasse Clausen (@unigoettingen) widmet sich der #DigitaleEdition des #Pädagogen Klaus Mollenhauer, ihrer Entstehung und den Nutzungsmöglichkeiten:
    ➡️ bbf.dipf.de/de/aktuell/termine

    #histed #textmining #datamining #DigitalHistory #DH #OpenData #FDM #history #histodons #OpenAccess @dipf_aktuell #Veranstaltungstipp

  13. @dipf_aktuell

    📣Der Märzvortrag unseres #DHELab am
    📅 27.3.2026 | 12-13 Uhr | Online
    mit Max Zeterberg (@subugoe) & Lasse Clausen (@unigoettingen) widmet sich der #DigitaleEdition des #Pädagogen Klaus Mollenhauer, ihrer Entstehung und den Nutzungsmöglichkeiten:
    ➡️ bbf.dipf.de/de/aktuell/t...

    #histed #textmining #datamining #DigitalHistory #DH #history #histodons @dipf_aktuell

  14. @dipf_aktuell

    📣Der Märzvortrag unseres #DHELab am
    📅 27.3.2026 | 12-13 Uhr | Online
    mit Max Zeterberg (@subugoe) & Lasse Clausen (@unigoettingen) widmet sich der #DigitaleEdition des #Pädagogen Klaus Mollenhauer, ihrer Entstehung und den Nutzungsmöglichkeiten:
    ➡️ bbf.dipf.de/de/aktuell/t...

    #histed #textmining #datamining #DigitalHistory #DH #history #histodons @dipf_aktuell

  15. 📢 Webinar: An introduction to #AVOBMAT
    A user-friendly platform for scalable, #multilingual #textmining and #metadata analysis, designed to support research and teaching in #DH. Hosted by @gwdg.
    Explore it at👉 avobmat.hu

    📆 Wed 11 Feb, 15:00–16:30 CET
    🖊️ Register: events.gwdg.de/event/1361/

    Used in 40 countries. We have preprocessed 5.4B tokens across multiple databases and made 32 databases publicly available.

    #DigitalHumanities #Zotero #Text+ #NLP #DH #DARIAH #Libraries #glam

  16. 📢 Webinar: An introduction to #AVOBMAT
    A user-friendly platform for scalable, #multilingual #textmining and #metadata analysis, designed to support research and teaching in #DH. Hosted by @gwdg.
    Explore it at👉 avobmat.hu

    📆 Wed 11 Feb, 15:00–16:30 CET
    🖊️ Register: events.gwdg.de/event/1361/

    Used in 40 countries. We have preprocessed 5.4B tokens across multiple databases and made 32 databases publicly available.

    #DigitalHumanities #Zotero #Text+ #NLP #DH #DARIAH #Libraries #glam

  17. A Guide to TF-IDF

    How to turn messy text into useful signals (without deep learning).

    TF-IDF is a simple way to convert text into numbers so you can search, rank, and classify documents.

    This post explains the intuition, the trade-offs, and a clean Python example you can reuse.

    :medium: hasanaligultekin.medium.com/a-

    #NLP #Python #DataScience #MachineLearning #TextMining #ai #medium #code

    @ai @theartificialintelligence @programming @towardsdatascience @pythonclcoding @medium @chartrdaily

  18. A Guide to TF-IDF

    How to turn messy text into useful signals (without deep learning).

    TF-IDF is a simple way to convert text into numbers so you can search, rank, and classify documents.

    This post explains the intuition, the trade-offs, and a clean Python example you can reuse.

    :medium: hasanaligultekin.medium.com/a-

    #NLP #Python #DataScience #MachineLearning #TextMining #ai #medium #code

    @ai @theartificialintelligence @programming @towardsdatascience @pythonclcoding @medium @chartrdaily

  19. 📣 CFP – Université d’été 2026 à l’IHA Paris
    Comment le numérique transforme-t-il l’histoire des migrations ? Sources massives, méthodes computationnelles, visualisations, enjeux éthiques…

    Master avancé, doctorant·e·s, post-docs : candidatez et venez discuter vos projets !

    📅 22–26 juin 2026 | 📨 deadline : 15 janvier 2026

    => dhiha.hypotheses.org/3813

    #migration #histoirenumerique #histodons #digitalhistory #HumanitésNumériques #histoiredesmigrations #SIG #textmining

  20. 📣 CFP – Université d’été 2026 à l’IHA Paris
    Comment le numérique transforme-t-il l’histoire des migrations ? Sources massives, méthodes computationnelles, visualisations, enjeux éthiques…

    Master avancé, doctorant·e·s, post-docs : candidatez et venez discuter vos projets !

    📅 22–26 juin 2026 | 📨 deadline : 15 janvier 2026

    => dhiha.hypotheses.org/3813

    #migration #histoirenumerique #histodons #digitalhistory #HumanitésNumériques #histoiredesmigrations #SIG #textmining

  21. 📢 Webinar: An introduction to #AVOBMAT
    A user-friendly platform for scalable, #multilingual #textmining and #metadata analysis, designed to support research and teaching in #DigitalHumanities. Hosted by @gwdg.
    Explore it at👉 avobmat.hu

    📆 Wed 8 Dec, 15:00–16:30 CET
    🖊️ Register: events.gwdg.de/event/1309/

    #DigitalHumanities #Zotero #Text+ #NLP #DH #DARIAH #Libraries #glam

  22. Why “public AI”, built on open source software, is the way forward for the EU

    A quarter of a century ago, I wrote a book called “Rebel Code”. It was the first – and is still the only – detailed history of the origins and rise of free software and open source, based on interviews with the gifted and generous hackers who took part. Back then, it was clear that open source represented a powerful alternative to the traditional proprietary approach to software […]

    #ai #aiAct #cdsm #china #cloudComputing #copyrightDirective #dataMining #eu #freeSoftware #openSource #openSourceInitiative #paulKeller #publicAi #rebelCode #research #startups #supercomputers #tdm #textMining #us #ventureCapital

    walledculture.org/why-public-a

  23. Kurzer Reminder für die heutige Online-Veranstaltung mit @cprog7 im Rahmen des @hermes_datenkompetenzzentrum Netzwerktreffens:

    "Buchstabensalat oder Haarknäuel? Zur Anwendbarkeit von Topic Modeling, Text Mining und Netzwerkanalyse"

    🗓️ 17. 11.2025 ⏰ 16:00-17:30 Uhr

    ➡️ Infos / Anmeldung: hermes-hub.de/aktuelles/events

    fedihum.org/@DHLab_IEG/1154965

    #DHLab_IEG #HERMES #DigitalHumanities #NLP #TextMining #NetzwerkAnalyse #HNR #Histodons

  24. Kurzer Reminder für die heutige Online-Veranstaltung mit @cprog7 im Rahmen des @hermes_datenkompetenzzentrum Netzwerktreffens:

    "Buchstabensalat oder Haarknäuel? Zur Anwendbarkeit von Topic Modeling, Text Mining und Netzwerkanalyse"

    🗓️ 17. 11.2025 ⏰ 16:00-17:30 Uhr

    ➡️ Infos / Anmeldung: hermes-hub.de/aktuelles/events

    fedihum.org/@DHLab_IEG/1154965

    #DHLab_IEG #HERMES #DigitalHumanities #NLP #TextMining #NetzwerkAnalyse #HNR #Histodons

  25. 🔔 Reminder: Nächstes virtuelles Netzwerktreffen des HERMES‑Promotionsnetzwerks
    🗓 Datum: 17. November 2025
    ⏰ Uhrzeit: 16:00 – 17:30 Uhr (online)

    Thema:
    🧩 „Buchstabensalat oder Haarknäuel? Zur Anwendbarkeit von Topic Modeling, Text Mining & Netzwerkanalyse“
    👤 Gast‑Speaker: Dr. Cindarella Petz vom Leibniz‑Institut für Europäische Geschichte (IEG)

    👉 Jetzt anmelden: hermes-hub.de/aktuelles/events

    @cprog7 #TextMining #TopicModeling #Netzwerkanalyse #DigitalHumanities

  26. How to detect “Slow Web” writing through text analysis:
    • Average sentence length → depth of reflection
    • First-person rate → level of introspection
    • Emotion polarity (lexicon-based) → calm or neutral tone
    • Buzzword ratio → viral or performative bias
    • Abstract/concrete balance → sincerity of voice
    • Style variance → steadiness of thought

    A quiet algorithm to find thoughtful writing.

    #SlowWeb #TextMining #DigitalHumanities #LoFiThinking #IndieWeb

  27. Promovierende aufgepasst: Ihr seid euch unsicher, ob Topic Modeling das richtige für eure computergestützten Auswertungen ist? Oder doch lieber (nicht) Netzwerkanalyse? Und welche Alternativen gäbe es? Am 17. 11. (16-17:30 Uhr) habt Ihr die Gelegenheit, euch darüber mit unserer Kollegin Cindarella Petz (@cprog7) im Rahmen des HERMES-Netzwerktreffens (online) auszutauschen.

    Infos / Anmeldung: hermes-hub.de/aktuelles/events

    #DHLab_IEG #HERMES #DigitalHumanities #NLP #TextMining #NetzwerkAnalyse #HNR

  28. Promovierende aufgepasst: Ihr seid euch unsicher, ob Topic Modeling das richtige für eure computergestützten Auswertungen ist? Oder doch lieber (nicht) Netzwerkanalyse? Und welche Alternativen gäbe es? Am 17. 11. (16-17:30 Uhr) habt Ihr die Gelegenheit, euch darüber mit unserer Kollegin Cindarella Petz (@cprog7) im Rahmen des HERMES-Netzwerktreffens (online) auszutauschen.

    Infos / Anmeldung: hermes-hub.de/aktuelles/events

    #DHLab_IEG #HERMES #DigitalHumanities #NLP #TextMining #NetzwerkAnalyse #HNR

  29. 🚀 AVOBMAT beta is live!
    A user-friendly platform for scalable, #multilingual #textmining and #metadata analysis, designed to support research and teaching in #DigitalHumanities. Hosted by @gwdg. Explore it at👉 avobmat.hu

    📢 Webinar: An introduction to #AVOBMAT
    📆 Wed 12 Nov, 15:00–16:30 CET
    🖊️ Register: events.gwdg.de/event/1267

    #nlp #glam #researchtools #zotero

  30. Nächstes virtuelles
    #Netzwerktreffen des HERMES-Promotionsnetzwerks

    17. November 2025, 16-17:30 Uhr

    🧩 „Buchstabensalat oder Haarknäuel? Zur Anwendbarkeit von #topicmodeling, #TextMining & #Netzwerkanalyse“ mit Dr. Cindarella Petz vom Leibniz-Institut für Europäische Geschichte (IEG)

    Was dich u.a. erwartet:
    ✨ Kurz Einführung in Topic Modeling – was steckt dahinter?
    🔎 Wie lassen sich Text Mining Methoden produktiv mit Netzwerkanalyse verbinden?

    👉 hermes-hub.de/aktuelles/events

    #DigitalHumanities

  31. 🤖 Aujourd’hui, dans le cadre de l’ANF TDM-IA 2025, le service Text & Data Mining (TDM) de l’Inist a présenté 👉 TDM Factory, une interface clé en main pour analyser et extraire automatiquement de l’information dans la littérature scientifique. 📚

    #InistCNRS #CNRS #TDMFactory #IA #TextMining

  32. 🤖 Aujourd’hui, dans le cadre de l’ANF TDM-IA 2025, le service Text & Data Mining (TDM) de l’Inist a présenté 👉 TDM Factory, une interface clé en main pour analyser et extraire automatiquement de l’information dans la littérature scientifique. 📚

    #InistCNRS #CNRS #TDMFactory #IA #TextMining

  33. Good news: laws to tackle AI deepfakes are coming. Bad news: they are based on copyright

    A key theme of Walled Culture the book (free digital versions available) is that copyright, born in an analogue age of scarcity, works poorly in today’s digital world of abundance. One manifestation of that is how lawmakers struggle to adapt the existing copyright rules to deal with novel technological developments, like the new generation of AI technologies. The EU’s AI Act marks a major […]

    #abundance #ai #aiAct #creativity #dataMining #deepfakes #democracy #denmark #eu #genai #italy #marketisation #maximalism #media #netherlands #openai #privacy #publicDomain #scarcity #sora #tdm #textMining

    walledculture.org/good-news-la

  34. #ISMBECCB2025 keynote Q&A: How will LLMs like ChatGPT affect the future of #biocuration ? I think Bairoch is hoping for domain specific integration with safeguards - like how #TextMining was adopted - he stresses this is not a panacea and needs engineering work

  35. #ISMBECCB2025 keynote Q&A: How will LLMs like ChatGPT affect the future of #biocuration ? I think Bairoch is hoping for domain specific integration with safeguards - like how #TextMining was adopted - he stresses this is not a panacea and needs engineering work

  36. 📯 Diese Woche im #DigitalHistoryOFK: Torsten Hiltmann und @DigHisNoah präsentieren "RAG den Spiegel" – ein innovatives RAG-System zur Analyse des SPIEGEL-Archivs. Der Vortrag zeigt, wie #LLMs Geschichtswissenschaft verändern und hermeneutische mit computationellen Methoden verbinden.
    📅 25. Juni, 16-18 Uhr, online (Zugang auf Anfrage)
    ℹ️ Abstract: dhistory.hypotheses.org/10912 #TextMining #4memory #DigitalHistory @historikerinnen @histodons @digitalhumanities

  37. 📯 Diese Woche im #DigitalHistoryOFK: Torsten Hiltmann und @DigHisNoah präsentieren "RAG den Spiegel" – ein innovatives RAG-System zur Analyse des SPIEGEL-Archivs. Der Vortrag zeigt, wie #LLMs Geschichtswissenschaft verändern und hermeneutische mit computationellen Methoden verbinden.
    📅 25. Juni, 16-18 Uhr, online (Zugang auf Anfrage)
    ℹ️ Abstract: dhistory.hypotheses.org/10912 #TextMining #4memory #DigitalHistory @historikerinnen @histodons @digitalhumanities

  38. Wissensrohstoff Text: eine Einführung in das #TextMining / Chris Biemann, Gerh. Heyer, Uwe Quasthoff.
    Das deutschspr. Standardlehrbuch zum Thema Text Mining
    vermittelt ein umfass. Verständnis der Grundlagen & Anwendungen des Text Minings.
    In der Stabi: katalogplus.sub.uni-hamburg.de

  39. 🚀 C’est aujourd’hui !

    La Journée “IA applicables aux textes” se tient à l’Hôtel de Ville de Montpellier.

    📌 Au programme : présentation des web services Istex (Pascal Cuxac) et échanges autour des usages concrets de l’IA textuelle.

    #IA #TextMining #Istex #Montpellier #Textmine

  40. Open Access book edited by Silke Schwandt: Digital Methods in the Humanities.
    Explore interdisciplinary challenges, case studies, and innovative perspectives on digital tools in textual research.
    Includes: From Serial Sources to Modeled Data, OCR, text mining & more.
    transcript-verlag.de/978-3-837
    #DigitalHumanities #OpenAccess #DigitalMethods #TextMining #HumanitiesResearch #SilkeSchwandt #transcriptVerlag

  41. Code4Lib: Distant Listening: Using Python and Apps Scripts to Text Mine and Tag Oral History Collections. “Designed for oral history project managers, the workflow empowers student workers to generate, modify, and expand subject tags during transcription editing, thereby enhancing the overall accuracy and discoverability of the collection. The paper details the workflow, surveys challenges […]

    https://rbfirehose.com/2025/04/15/distant-listening-using-python-and-apps-scripts-to-text-mine-and-tag-oral-history-collections-code4lib/