home.social

#korpus — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #korpus, aggregated by home.social.

  1. Neues #Korpus im DWDS: Die Artikel des Wochenmagazins „Der Spiegel“ (ab 2013) stehen angemeldeten Nutzerinnen und Nutzern jetzt für die Recherche zur Verfügung: dwds.de/d/korpora/spie #Linguistik

  2. Hier eine persönliche Auswahl von tatsächlich im #Korpus vorkommenden schönen Modifikationen von "langsam" (von oben nach unten nach Häufigkeit sortiert). Mit dabei: Viele Tiere!

    - zeitlupenlangsam
    - schneckenlangsam 🐌
    - schnelllangsam (?!?)
    - schildkrötenlangsam 🐢
    - schweinelangsam 🐷
    - hyperlangsam
    - hundslangsam 🐕‍🦺
    - rasendlangsam
    - ameisenlangsam 🐜
    - krötenlangsam 🐸
    - lavalangsam
    - tuckerlangsam
    - zentimeterlangsam

    (Quelle: DeReKoGram, owid.de/plus/derekogram)

    #linguistics

  3. To whom it may concern...

    Kurzauszug aus aktueller #Korpus -Studie

    "hin- und/oder herX"
    X = finites Verb, Verb im Infinitiv oder Partizip Perfekt

    Platz 1: hin- und hergerissen (duh!)
    Platz 2: hin- und hergeschoben
    Platz 3: hin- und herschieben (s. Platz 2)
    Platz 4: hin- und herfahren
    Platz 5: hin- und herpendeln
    Platz 6: hin- und hergeschickt
    Platz 7: hin- und hergefahren (s. Platz 4)
    Platz 8: hin- und hergeworfen
    Platz 9: hin- und herwechseln
    Platz 10: hin- und herpendelt (s. Platz 5)

    "hin- und hergerissen" ist dabei immer noch häufiger als Plätze 2 bis 10 zusammengenommen.

    Wie gesagt: "und" kann in der obigen Liste auch immer "oder" sein.

    Quelle: DeReKoGram (owid.de/plus/derekogram/)

    #linguistics

  4. Hallo liebes Fediversum,
    wir, das DGS-Korpus-Projekt, sind nun auch auf Mastodon gelandet! Wir sind ein Langzeitprojekt zur Dokumentation und Erforschung der Deutschen Gebärdensprache (DGS). Mit unserem Account möchten wir euch über aktuelle Entwicklungen des Projekts informieren und das von uns entwickelte Korpus und Wörterbuch vorstellen. Unsere Posts sind in DGS und Deutsch. #DGS #DeutscheGebärdensprache #Gebärdensprache #Linguistik #Korpus
    Disclaimer: Wenn wir Videos posten, dann ist der begleitende Text keine eins zu eins Übersetzung dessen, was im Video zu sehen ist, sondern eher eine Zusammenfassung.

  5. #Neuigkeiten zu den #Korpora im DWDS: Zwei Zeitungsquellen im „ZDL-Regionalkorpus“ wurden ersetzt und es gibt eine neue statistische Basis für regionale Verteilungen im „Webmonitor-Korpus“. Nähere Informationen im aktuellen #Blog​-Artikel dwds.de/b/neues-zum-zdl-region #Linguistik #Korpus

  6. Neu im DWDS: Reddit-d – ein #Korpus mit über 1,34 Milliarden Tokens aus deutschsprachigen #Reddit​-Kommentaren für ein breites Spektrum linguistischer Untersuchungen. Auf Anfrage via DWDS zugänglich. Weitere Infos unter dwds.de/d/korpora/reddit #Linguistik

  7. "Zum 20. Jubiläum: Romane des Deutschen Buchpreises jetzt für die Sprachforschung nutzbar" vermeldet das DHd-Blog: dhd-blog.org/?p=21686.
    Direkt zum Korpus: korap.dnb.de/deutscherbuchprei.
    #Literatur #Korpus #Romane #DeutscherBuchpreis

  8. #neu​es Sprach-#Korpus fürs #Englisch​e: "ICE Nigeria: A corpus of spoken and written Nigerian English" miami.uni-muenster.de/Record/1
    #Sprachwissenschaft #Anglistik #openaccess
    "[T]he written part is avilable as text files and xml files with parts of speech tagging. For the spoken part, the eaf xml files with the text files are available. The sound files can be downloaded in a separate file. In addition, we provide the corpus manual as well as a spreadsheet with metadata (speaker age, gender, …)."

  9. Aktuell im #Korpus​angebot des DWDS: neue/überarbeitete Zeitungskorpora sowie ein neues, frei zugängliches Metakorpus mit vielfältigen #Texte​n der #deutsch​en Gegenwartssprache. Alle Informationen im Überblick: dwds.de/b/aktuelles-aus-dem-dw

  10. Kielipankin Kuukauden tutkija -juttusarjassa on esittelyvuorossa Liisa Mustanoja. Hän kertoo meille sosiolingvistiikkaan liittyvästä tutkimuksestaan sekä esittelee vielä työn alla olevan Tampereen puhekielen pitkittäiskorpuksen. Lue juttu Kielipankin blogista: kielipankki.fi/uutiset/kuukaud

    #Kielipankki #KuukaudenTutkija #aineisto #korpus #suomenkieli #suomi #kielentutkimus #kielitiede #sosiolingvistiikka #kieliteknologia #yliopisto #yliopistot #tutkimus

  11. Kielipankki toivottaa kaikille tämän uutiskirjeen myötä rauhallista keskitalven aikaa! Henkilökuntamme lomailee ajalla 23.12.2023–7.1.2024, jonka jälkeen palaamme taas mm. KLK:n osakorpuksen laajennuksen ja Korpin päivityksen pariin. Lue lisää uutiskirjeestämme Kielipankin kuluneesta vuodesta sekä tulevasta kaudesta: kielipankki.fi/uutiset/kielipa

    #Kielipankki #kieliteknologia #aineisto #korpus #tutkimus #yliopisto #yliopistot #kielitiede #KuukaudenTutkija

  12. Neu: Das ZDL-Regionalkorpus ist für DWDS-Nutzer/innen nun für die gesamte D-A-CH-Region recherchierbar und somit das größte #Korpus zur Untersuchung #regional​er Variation der #deutsch​en Standardsprache. Mehr Informationen: sprache.hypotheses.org/2985 | Direkt zum Korpus: dwds.de/d/korpora/regional
    @ACDHCH_OeAW

  13. ATF - WTF? Was abgeleitete Textformate sind und welche Vorteile und Herausforderungen sie für quantitative Textanalysen mit sich bringen, erläutert auf unserem Blog @cnDuKeli von der @trieruni:

    textplus.hypotheses.org/8062

    #Textplus #CLS #DH #Korpus #Literatur #TextplusBlog

  14. Kielipankin #KuukaudenTutkija -juttusarjassa on esittelyvuorossa Anna Dmitrieva Helsingin yliopiston HELSLANG-tohtoriohjelmasta. Hän kertoo meille selkokielistämiseen liittyvästä tutkimuksestaan. Lue juttu Kielipankin blogista: kielipankki.fi/uutiset/kuukaud

    #WeAreHelsinkiUni #Kielipankki #kieliteknologia #aineisto #korpus #selkokieli #HELSLANG #yliopisto #tutkimus #kielitiede #suomi

  15. CLARIN2023 #konferenssi järjestetään 16.-18.10.2023 hybridimuotoisena. Tapahtumassa käsiteltäviä #kieliteknologia'an liittyviä aiheita on paljon, kuten erilaisten kieliaineistojen demot sekä laajan ParlaMint-hankkeen esittely. Lisäksi huomiota saavat myös generatiiviseen tekoälyyn liittyvät kysymykset (mm. tekijänoikeudet tai eettiset kysymykset).

    #CLARIN2023-tapahtumaan voi osallistua maksutta etänä, kunhan rekisteröidyt etukäteen täällä: clarin.eu/event/2023/clarin-an

    #tutkimus #digihum #korpus

  16. Kielipankin #KuukaudenTutkija -juttusarjassa esittelemme erikoistutkija Nobufumi Inaban Turun yliopistolta, Suomen ja sen sukukielten arkistosta. Hän kertoo meille valmistelemastaan korpuksesta, joka tuo kielenmuutoksesta kiinnostuneiden tutkijoiden saataville lähdetekstin vuodelta 1526. Lue juttu Kielipankin verkkosivuilta: kielipankki.fi/uutiset/kuukaud
    #kielitiede #kielentutkimus #korpus #aineisto #digihum #kieliteknologia #Kielipankki #tutkimus #yliopisto #yliopistot #tiede

  17. "Eihän siinä voi olla vihainen!" on lausahdus, jonka rakenne kutkuttelee kielentutkijan mieltä.

    Kielipankin #KuukaudenTutkija-juttusarjassa esittelemme on Mikael Varjon. Hän kertoo blogissamme tutkimuksestaan, joka käsittelee suomenkielisten arkikeskustelujen nollasubjektilauseita Arkisyn-korpuksessa. Lue tutkijaesittely täältä: kielipankki.fi/uutiset/kuukaud
    #Kielipankki #kielitiede #aineisto #korpus #digihum #kieliteknologia #suomi #tutkimus #suomenkieli #yliopisto

  18. Kiinnostaako sinua oppia käyttämään CSC:n laskennallista ympäristöä kielivarojen käsittelyyn? Haluatko tietää lisää kielivaroista ja mahdollisuuksista käyttää niitä tutkimuksessasi?

    CSC – Tieteen tietotekniikan keskus järjestää 20.–21.6.2023 etäkurssin näistä aiheista.

    Lue lisää ja ilmoittaudu mukaan kesäkuun kurssille: kielipankki.fi/uutiset/csc-jar

    #Kielipankki #aineisto #korpus #kieliteknologia #kielitiede #suomi #tutkimus #yliopisto

  19. @emitanaka @benmarwick That is a great tip! Just tried in . I didn't notice the usage of in . koRpus is developed by Meik Michalke, who is also a developer of RKWard. koRpus has quite a nice GUI support in RKWard. Great work!

  20. Neu: #Wikipedia-#Korpus mit Volltexten aus Artikeln aus der deutschsprachigen Wikipedia im Digitalen #Wörterbuch der deutschen Sprache #DWDS

    dwds.de/d/korpora/wikipedia