#text-mining — Public Fediverse posts
Live and recent posts from across the Fediverse tagged #text-mining, aggregated by home.social.
-
Random Thoughts: Searchable comics text pages?. “After finding a collection of Marvel Bullpen Bulletins for the search engine for magazines about comics, I started to wonder whether it’d be useful (or fun) to include text pages from comics in general. I mean — editorials, letters pages, ‘hype pages’… There’s information there that’s not available anywhere else. So… perhaps? Maybe?”
https://rbfirehose.com/2026/06/19/random-thoughts-searchable-comics-text-pages/ -
Random Thoughts: Searchable comics text pages?. “After finding a collection of Marvel Bullpen Bulletins for the search engine for magazines about comics, I started to wonder whether it’d be useful (or fun) to include text pages from comics in general. I mean — editorials, letters pages, ‘hype pages’… There’s information there that’s not available anywhere else. So… perhaps? Maybe?”
https://rbfirehose.com/2026/06/19/random-thoughts-searchable-comics-text-pages/ -
Repenser l'histoire de la migration à l'ère du #numérique. Dans deux semaines, notre université d’été (en collaboration avec le #C2DH de Luxembourg) explorera la manière dont les #méthodesnumériques révolutionnent la #recherche sur les #migrations – du #textmining aux #SIG ⬇️
📍 22.07-26.07. | IHA
🔤 fr/en#DigitalHumanities #DigitalHistory #histoirenumérique #DH #Migrationsgeschichte #Migrationhistory #summeruniversity
https://www.dhi-paris.fr/fr/agenda-detaillees/migrationgeschichte-mit-digitalen-methoden.html -
Repenser l'histoire de la migration à l'ère du #numérique. Dans deux semaines, notre université d’été (en collaboration avec le #C2DH de Luxembourg) explorera la manière dont les #méthodesnumériques révolutionnent la #recherche sur les #migrations – du #textmining aux #SIG ⬇️
📍 22.07-26.07. | IHA
🔤 fr/en#DigitalHumanities #DigitalHistory #histoirenumérique #DH #Migrationsgeschichte #Migrationhistory #summeruniversity
https://www.dhi-paris.fr/fr/agenda-detaillees/migrationgeschichte-mit-digitalen-methoden.html -
🚀 Accéder à TDM Factory est désormais encore plus simple grâce à l’authentification via la fédération d’identité Renater.
Testez les 22 web services de fouille de textes sur vos propres données 👇
https://tdm-factory.services.istex.fr/#TDMFactory #ISTEX #Renater #TextMining #ESR #ScienceOuverte
-
🚀 Accéder à TDM Factory est désormais encore plus simple grâce à l’authentification via la fédération d’identité Renater.
Testez les 22 web services de fouille de textes sur vos propres données 👇
https://tdm-factory.services.istex.fr/#TDMFactory #ISTEX #Renater #TextMining #ESR #ScienceOuverte
-
📺 Recording now available!
Missed our recent R-Ladies Rome workshop on Text Analysis in R: From tidytext to Local LLMs?
In this session, Dariia Mykhailyshyna walks through a complete text analysis workflow in R
Watch the recording 🎥 https://youtu.be/b8WhdKCkdEo
#RLadiesRome #rstats #NLP #TextMining #DataScience #AI #LLM #Ollama -
📺 Recording now available!
Missed our recent R-Ladies Rome workshop on Text Analysis in R: From tidytext to Local LLMs?
In this session, Dariia Mykhailyshyna walks through a complete text analysis workflow in R
Watch the recording 🎥 https://youtu.be/b8WhdKCkdEo
#RLadiesRome #rstats #NLP #TextMining #DataScience #AI #LLM #Ollama -
🔎 Envie de découvrir le Text & Data Mining sans être expert en informatique ?
Participez au webinaire « Découverte de TDM Factory »
Au programme : démonstration de l’interface, cas d’usage et échanges autour des possibilités offertes par la fouille de textes et de données pour analyser vos corpus, extraire des concepts ou repérer des tendances.
📅 demain, 20 mai 2026 — 11h à 12h
👉 En savoir plus : https://www.inist.fr/services/former/webinaire/decouverte-de-tdm-factory/
-
🔎 Envie de découvrir le Text & Data Mining sans être expert en informatique ?
Participez au webinaire « Découverte de TDM Factory »
Au programme : démonstration de l’interface, cas d’usage et échanges autour des possibilités offertes par la fouille de textes et de données pour analyser vos corpus, extraire des concepts ou repérer des tendances.
📅 demain, 20 mai 2026 — 11h à 12h
👉 En savoir plus : https://www.inist.fr/services/former/webinaire/decouverte-de-tdm-factory/
-
👉 Découvrez Istex View, la visionneuse pour explorer les documents XML-TEI et leurs enrichissements.
🔗 https://www.inist.fr/nos-actualites/istex-view-visionner-les-documents-tei/
#ISTEX #OpenScience #TEI #TextMining #Recherche -
👉 Découvrez Istex View, la visionneuse pour explorer les documents XML-TEI et leurs enrichissements.
🔗 https://www.inist.fr/nos-actualites/istex-view-visionner-les-documents-tei/
#ISTEX #OpenScience #TEI #TextMining #Recherche -
📣Der Märzvortrag unseres #DHELab nächste Woche am
📅 Fr, 27.3.2026 | 12-13 Uhr | Online
Mit Max Zeterberg (@subugoe) & Lasse Clausen (@unigoettingen) widmet sich der #DigitaleEdition des #Pädagogen Klaus Mollenhauer, ihrer Entstehung und den Nutzungsmöglichkeiten:
➡️ https://bbf.dipf.de/de/aktuell/termine/dhelab-vortrag-2026-03#histed #textmining #datamining #DigitalHistory #DH #OpenData #FDM #history #histodons #OpenAccess @dipf_aktuell
-
📣Der Märzvortrag unseres #DHELab nächste Woche am
📅 Fr, 27.3.2026 | 12-13 Uhr | Online
Mit Max Zeterberg (@subugoe) & Lasse Clausen (@unigoettingen) widmet sich der #DigitaleEdition des #Pädagogen Klaus Mollenhauer, ihrer Entstehung und den Nutzungsmöglichkeiten:
➡️ https://bbf.dipf.de/de/aktuell/termine/dhelab-vortrag-2026-03#histed #textmining #datamining #DigitalHistory #DH #OpenData #FDM #history #histodons #OpenAccess @dipf_aktuell #Veranstaltungstipp
-
📣Der Märzvortrag unseres #DHELab am
📅 27.3.2026 | 12-13 Uhr | Online
mit Max Zeterberg (@subugoe) & Lasse Clausen (@unigoettingen) widmet sich der #DigitaleEdition des #Pädagogen Klaus Mollenhauer, ihrer Entstehung und den Nutzungsmöglichkeiten:
➡️ bbf.dipf.de/de/aktuell/t...#histed #textmining #datamining #DigitalHistory #DH #history #histodons @dipf_aktuell
-
📣Der Märzvortrag unseres #DHELab am
📅 27.3.2026 | 12-13 Uhr | Online
mit Max Zeterberg (@subugoe) & Lasse Clausen (@unigoettingen) widmet sich der #DigitaleEdition des #Pädagogen Klaus Mollenhauer, ihrer Entstehung und den Nutzungsmöglichkeiten:
➡️ bbf.dipf.de/de/aktuell/t...#histed #textmining #datamining #DigitalHistory #DH #history #histodons @dipf_aktuell
-
📢 Webinar: An introduction to #AVOBMAT
A user-friendly platform for scalable, #multilingual #textmining and #metadata analysis, designed to support research and teaching in #DH. Hosted by @gwdg.
Explore it at👉 https://avobmat.hu📆 Wed 11 Feb, 15:00–16:30 CET
🖊️ Register: https://events.gwdg.de/event/1361/Used in 40 countries. We have preprocessed 5.4B tokens across multiple databases and made 32 databases publicly available.
#DigitalHumanities #Zotero #Text+ #NLP #DH #DARIAH #Libraries #glam
-
📢 Webinar: An introduction to #AVOBMAT
A user-friendly platform for scalable, #multilingual #textmining and #metadata analysis, designed to support research and teaching in #DH. Hosted by @gwdg.
Explore it at👉 https://avobmat.hu📆 Wed 11 Feb, 15:00–16:30 CET
🖊️ Register: https://events.gwdg.de/event/1361/Used in 40 countries. We have preprocessed 5.4B tokens across multiple databases and made 32 databases publicly available.
#DigitalHumanities #Zotero #Text+ #NLP #DH #DARIAH #Libraries #glam
-
A Guide to TF-IDF
How to turn messy text into useful signals (without deep learning).
TF-IDF is a simple way to convert text into numbers so you can search, rank, and classify documents.
This post explains the intuition, the trade-offs, and a clean Python example you can reuse.
:medium: https://hasanaligultekin.medium.com/a-guide-to-tf-idf-cbb1bc3d18f5
#NLP #Python #DataScience #MachineLearning #TextMining #ai #medium #code
@ai @theartificialintelligence @programming @towardsdatascience @pythonclcoding @medium @chartrdaily
-
A Guide to TF-IDF
How to turn messy text into useful signals (without deep learning).
TF-IDF is a simple way to convert text into numbers so you can search, rank, and classify documents.
This post explains the intuition, the trade-offs, and a clean Python example you can reuse.
:medium: https://hasanaligultekin.medium.com/a-guide-to-tf-idf-cbb1bc3d18f5
#NLP #Python #DataScience #MachineLearning #TextMining #ai #medium #code
@ai @theartificialintelligence @programming @towardsdatascience @pythonclcoding @medium @chartrdaily
-
📣 CFP – Université d’été 2026 à l’IHA Paris
Comment le numérique transforme-t-il l’histoire des migrations ? Sources massives, méthodes computationnelles, visualisations, enjeux éthiques…Master avancé, doctorant·e·s, post-docs : candidatez et venez discuter vos projets !
📅 22–26 juin 2026 | 📨 deadline : 15 janvier 2026
=> https://dhiha.hypotheses.org/3813
#migration #histoirenumerique #histodons #digitalhistory #HumanitésNumériques #histoiredesmigrations #SIG #textmining
-
📣 CFP – Université d’été 2026 à l’IHA Paris
Comment le numérique transforme-t-il l’histoire des migrations ? Sources massives, méthodes computationnelles, visualisations, enjeux éthiques…Master avancé, doctorant·e·s, post-docs : candidatez et venez discuter vos projets !
📅 22–26 juin 2026 | 📨 deadline : 15 janvier 2026
=> https://dhiha.hypotheses.org/3813
#migration #histoirenumerique #histodons #digitalhistory #HumanitésNumériques #histoiredesmigrations #SIG #textmining
-
📢 Webinar: An introduction to #AVOBMAT
A user-friendly platform for scalable, #multilingual #textmining and #metadata analysis, designed to support research and teaching in #DigitalHumanities. Hosted by @gwdg.
Explore it at👉 https://avobmat.hu📆 Wed 8 Dec, 15:00–16:30 CET
🖊️ Register: https://events.gwdg.de/event/1309/#DigitalHumanities #Zotero #Text+ #NLP #DH #DARIAH #Libraries #glam
-
Why “public AI”, built on open source software, is the way forward for the EU
A quarter of a century ago, I wrote a book called “Rebel Code”. It was the first – and is still the only – detailed history of the origins and rise of free software and open source, based on interviews with the gifted and generous hackers who took part. Back then, it was clear that open source represented a powerful alternative to the traditional proprietary approach to software […]
#ai #aiAct #cdsm #china #cloudComputing #copyrightDirective #dataMining #eu #freeSoftware #openSource #openSourceInitiative #paulKeller #publicAi #rebelCode #research #startups #supercomputers #tdm #textMining #us #ventureCapital
https://walledculture.org/why-public-ai-built-on-open-source-software-is-the-way-forward-for-the-eu/
-
Kurzer Reminder für die heutige Online-Veranstaltung mit @cprog7 im Rahmen des @hermes_datenkompetenzzentrum Netzwerktreffens:
"Buchstabensalat oder Haarknäuel? Zur Anwendbarkeit von Topic Modeling, Text Mining und Netzwerkanalyse"
🗓️ 17. 11.2025 ⏰ 16:00-17:30 Uhr
➡️ Infos / Anmeldung: https://hermes-hub.de/aktuelles/events/netzwerktreffen-2025-11-17.html
https://fedihum.org/@DHLab_IEG/115496585951698396
#DHLab_IEG #HERMES #DigitalHumanities #NLP #TextMining #NetzwerkAnalyse #HNR #Histodons
-
Kurzer Reminder für die heutige Online-Veranstaltung mit @cprog7 im Rahmen des @hermes_datenkompetenzzentrum Netzwerktreffens:
"Buchstabensalat oder Haarknäuel? Zur Anwendbarkeit von Topic Modeling, Text Mining und Netzwerkanalyse"
🗓️ 17. 11.2025 ⏰ 16:00-17:30 Uhr
➡️ Infos / Anmeldung: https://hermes-hub.de/aktuelles/events/netzwerktreffen-2025-11-17.html
https://fedihum.org/@DHLab_IEG/115496585951698396
#DHLab_IEG #HERMES #DigitalHumanities #NLP #TextMining #NetzwerkAnalyse #HNR #Histodons
-
🔔 Reminder: Nächstes virtuelles Netzwerktreffen des HERMES‑Promotionsnetzwerks
🗓 Datum: 17. November 2025
⏰ Uhrzeit: 16:00 – 17:30 Uhr (online)Thema:
🧩 „Buchstabensalat oder Haarknäuel? Zur Anwendbarkeit von Topic Modeling, Text Mining & Netzwerkanalyse“
👤 Gast‑Speaker: Dr. Cindarella Petz vom Leibniz‑Institut für Europäische Geschichte (IEG)👉 Jetzt anmelden: https://hermes-hub.de/aktuelles/events/netzwerktreffen-2025-11-17.html
@cprog7 #TextMining #TopicModeling #Netzwerkanalyse #DigitalHumanities
-
How to detect “Slow Web” writing through text analysis:
• Average sentence length → depth of reflection
• First-person rate → level of introspection
• Emotion polarity (lexicon-based) → calm or neutral tone
• Buzzword ratio → viral or performative bias
• Abstract/concrete balance → sincerity of voice
• Style variance → steadiness of thoughtA quiet algorithm to find thoughtful writing.
#SlowWeb #TextMining #DigitalHumanities #LoFiThinking #IndieWeb
-
Promovierende aufgepasst: Ihr seid euch unsicher, ob Topic Modeling das richtige für eure computergestützten Auswertungen ist? Oder doch lieber (nicht) Netzwerkanalyse? Und welche Alternativen gäbe es? Am 17. 11. (16-17:30 Uhr) habt Ihr die Gelegenheit, euch darüber mit unserer Kollegin Cindarella Petz (@cprog7) im Rahmen des HERMES-Netzwerktreffens (online) auszutauschen.
Infos / Anmeldung: https://hermes-hub.de/aktuelles/events/netzwerktreffen-2025-11-17.html
#DHLab_IEG #HERMES #DigitalHumanities #NLP #TextMining #NetzwerkAnalyse #HNR
-
Promovierende aufgepasst: Ihr seid euch unsicher, ob Topic Modeling das richtige für eure computergestützten Auswertungen ist? Oder doch lieber (nicht) Netzwerkanalyse? Und welche Alternativen gäbe es? Am 17. 11. (16-17:30 Uhr) habt Ihr die Gelegenheit, euch darüber mit unserer Kollegin Cindarella Petz (@cprog7) im Rahmen des HERMES-Netzwerktreffens (online) auszutauschen.
Infos / Anmeldung: https://hermes-hub.de/aktuelles/events/netzwerktreffen-2025-11-17.html
#DHLab_IEG #HERMES #DigitalHumanities #NLP #TextMining #NetzwerkAnalyse #HNR
-
🚀 AVOBMAT beta is live!
A user-friendly platform for scalable, #multilingual #textmining and #metadata analysis, designed to support research and teaching in #DigitalHumanities. Hosted by @gwdg. Explore it at👉 https://avobmat.hu📢 Webinar: An introduction to #AVOBMAT
📆 Wed 12 Nov, 15:00–16:30 CET
🖊️ Register: https://events.gwdg.de/event/1267 -
Nächstes virtuelles
#Netzwerktreffen des HERMES-Promotionsnetzwerks17. November 2025, 16-17:30 Uhr
🧩 „Buchstabensalat oder Haarknäuel? Zur Anwendbarkeit von #topicmodeling, #TextMining & #Netzwerkanalyse“ mit Dr. Cindarella Petz vom Leibniz-Institut für Europäische Geschichte (IEG)
Was dich u.a. erwartet:
✨ Kurz Einführung in Topic Modeling – was steckt dahinter?
🔎 Wie lassen sich Text Mining Methoden produktiv mit Netzwerkanalyse verbinden?👉 https://hermes-hub.de/aktuelles/events/netzwerktreffen-2025-11-17.html
-
🤖 Aujourd’hui, dans le cadre de l’ANF TDM-IA 2025, le service Text & Data Mining (TDM) de l’Inist a présenté 👉 TDM Factory, une interface clé en main pour analyser et extraire automatiquement de l’information dans la littérature scientifique. 📚
-
🤖 Aujourd’hui, dans le cadre de l’ANF TDM-IA 2025, le service Text & Data Mining (TDM) de l’Inist a présenté 👉 TDM Factory, une interface clé en main pour analyser et extraire automatiquement de l’information dans la littérature scientifique. 📚
-
Good news: laws to tackle AI deepfakes are coming. Bad news: they are based on copyright
A key theme of Walled Culture the book (free digital versions available) is that copyright, born in an analogue age of scarcity, works poorly in today’s digital world of abundance. One manifestation of that is how lawmakers struggle to adapt the existing copyright rules to deal with novel technological developments, like the new generation of AI technologies. The EU’s AI Act marks a major […]
#abundance #ai #aiAct #creativity #dataMining #deepfakes #democracy #denmark #eu #genai #italy #marketisation #maximalism #media #netherlands #openai #privacy #publicDomain #scarcity #sora #tdm #textMining
-
🎥 Le replay du 3ᵉ webinaire LODEX est en ligne !
👉 https://www.canal-u.tv/chaines/inist-cnrs/exploration-et-analyse-avancee-de-corpus-avec-lodex
Toute la collection des 3 webinaires (vidéos + docs) est dispo sur Canal-U#LODEX #Webinaire #OpenScience #Data #TextMining #DataVisualization
-
🎥 Le replay du 3ᵉ webinaire LODEX est en ligne !
👉 https://www.canal-u.tv/chaines/inist-cnrs/exploration-et-analyse-avancee-de-corpus-avec-lodex
Toute la collection des 3 webinaires (vidéos + docs) est dispo sur Canal-U#LODEX #Webinaire #OpenScience #Data #TextMining #DataVisualization
-
#ISMBECCB2025 keynote Q&A: How will LLMs like ChatGPT affect the future of #biocuration ? I think Bairoch is hoping for domain specific integration with safeguards - like how #TextMining was adopted - he stresses this is not a panacea and needs engineering work
-
#ISMBECCB2025 keynote Q&A: How will LLMs like ChatGPT affect the future of #biocuration ? I think Bairoch is hoping for domain specific integration with safeguards - like how #TextMining was adopted - he stresses this is not a panacea and needs engineering work
-
#Hinweis auf #Nutzbarkeit von #Data #Analytics / #Data #Science #Methoden #Scraping, #Pattern #Recognition, #Machine #Learning oder #Text #Mining für #soziologische #Forschung.
#Sutter / #Maasen - #Neuerfindung #Soziologie S.76 f. 2020 DOI: 10.5771/9783845295008-73
#MachineLearning #ML #TextMining #Soziologie #BigData #Methodologie #Methodik #Sozialforschung #Sozialwissenschaft
-
📯 Diese Woche im #DigitalHistoryOFK: Torsten Hiltmann und @DigHisNoah präsentieren "RAG den Spiegel" – ein innovatives RAG-System zur Analyse des SPIEGEL-Archivs. Der Vortrag zeigt, wie #LLMs Geschichtswissenschaft verändern und hermeneutische mit computationellen Methoden verbinden.
📅 25. Juni, 16-18 Uhr, online (Zugang auf Anfrage)
ℹ️ Abstract: https://dhistory.hypotheses.org/10912 #TextMining #4memory #DigitalHistory @historikerinnen @histodons @digitalhumanities -
📯 Diese Woche im #DigitalHistoryOFK: Torsten Hiltmann und @DigHisNoah präsentieren "RAG den Spiegel" – ein innovatives RAG-System zur Analyse des SPIEGEL-Archivs. Der Vortrag zeigt, wie #LLMs Geschichtswissenschaft verändern und hermeneutische mit computationellen Methoden verbinden.
📅 25. Juni, 16-18 Uhr, online (Zugang auf Anfrage)
ℹ️ Abstract: https://dhistory.hypotheses.org/10912 #TextMining #4memory #DigitalHistory @historikerinnen @histodons @digitalhumanities -
Wissensrohstoff Text: eine Einführung in das #TextMining / Chris Biemann, Gerh. Heyer, Uwe Quasthoff.
Das deutschspr. Standardlehrbuch zum Thema Text Mining
vermittelt ein umfass. Verständnis der Grundlagen & Anwendungen des Text Minings.
In der Stabi: https://katalogplus.sub.uni-hamburg.de/vufind/Record/1804279692 -
🚀 C’est aujourd’hui !
La Journée “IA applicables aux textes” se tient à l’Hôtel de Ville de Montpellier.
📌 Au programme : présentation des web services Istex (Pascal Cuxac) et échanges autour des usages concrets de l’IA textuelle.
-
I modeled the Voynich Manuscript with SBERT to test for structure
https://github.com/brianmg/voynich-nlp-analysis
#HackerNews #VoynichManuscript #SBERT #NLP #Analysis #DataScience #TextMining
-
Open Access book edited by Silke Schwandt: Digital Methods in the Humanities.
Explore interdisciplinary challenges, case studies, and innovative perspectives on digital tools in textual research.
Includes: From Serial Sources to Modeled Data, OCR, text mining & more.
https://www.transcript-verlag.de/978-3-8376-5419-6/digital-methods-in-the-humanities
#DigitalHumanities #OpenAccess #DigitalMethods #TextMining #HumanitiesResearch #SilkeSchwandt #transcriptVerlag -
Code4Lib: Distant Listening: Using Python and Apps Scripts to Text Mine and Tag Oral History Collections. “Designed for oral history project managers, the workflow empowers student workers to generate, modify, and expand subject tags during transcription editing, thereby enhancing the overall accuracy and discoverability of the collection. The paper details the workflow, surveys challenges […]
-
Vom #Archiv zur #Datenbank. Was #TextMining und #GraphModelling Verfahren zu einer vergleichenden #Sozialgeschichte des Zwangs im #Spätmittelalter beitragen können: Juliane Schiel (Univ. Wien) beim morgigen #Jeudi-Vortrag mit Kommentar von Simona Cerutti (EHESS)
10.04. | 18:00 | hybrid | DE-FR
@histodons #WORCK #DH #digitaleTextanalyse #DigitalHumanties #DigitalHistory
-
Vom #Archiv zur #Datenbank. Was #TextMining und #GraphModelling Verfahren zu einer vergleichenden #Sozialgeschichte des Zwangs im #Spätmittelalter beitragen können: Juliane Schiel (Univ. Wien) beim nächsten #Jeudi-Vortrag mit Kommentar von Simona Cerutti (EHESS)
10.04. | 18:00 | hybrid | DE-FR
@histodons #WORCK #DH #digitaleTextanalyse #DigitalHumanties #DigitalHistory
-
For Immediate Release, April 1, 2025: University of Michigan Press will publish all of the content on Meta platforms as a series of printed books.
https://www.linkedin.com/posts/charles-watkinson-7553a257_amphibians-and-reptiles-of-the-great-lakes-activity-7312775744932179968-sLSu#MetaPlatforms #Instagram #Facebook #ThreadsApp #Copyright #BookPublishing #TextMining #TextCorpora #WebScraping #AIethics