#dataaktivismi — Public Fediverse posts
Live and recent posts from across the Fediverse tagged #dataaktivismi, aggregated by home.social.
-
FLOSS Manualsin avoimen lähdekoodin opas. Julkaistaan GPL-lisenssillä.
Data-aktivismi on projektin blogi.
Suomenkielinen FLOSS Manuals on nykyisin vapaaehtoistyöhön perustuva projekti jolla ei ole minkäänlaista rahoitusta.
Tekniset kysymyksetKirjoitusalusta
FLOSS Manuals käytti ennen Booktypeä, mutta sen kehitys on loppunut. Nyt on valinnanvaraa mitä tässä projektissa tahtoo käyttää.
BookStack, GitHub, Etherpad vai joku muu? Olen oikeastaan sitä mieltä että olisi parasta pitää GitHubia ensisijaisena alustana ja käyttää kollaboratiiviseen bookprint-kirjoittamiseen vaikka Etherpadia. Tähän tulee Jupyter Notepadeja jotka on kuitenkin pakko linkittää GitHubista. GitLab olisi kyllä oikeaoppisempi kuin GitHub.
Taitaa olla järkevintä että osallistujat käyttävät sitä kirjoitusalustaa joka tuntuu luontevimmalta. Booksprinttien kaltaiseen kollaboratiiviseen kirjoittamiseen voidaan myös valita osallistujille sopivin alusta. Etherpad olisi kyllä paras booksprintteihin. Tekstit voi kuitenkin kirjoittaa vaikka tekstinkäsittelyohjelmalla ja lähettää sähköpostilla, kuten usein tapahtuukin. Kasaan sitten sisällön tänne GitHub-repoon ja julkaisen oppaan FLOSS Manualsin sivuilla kun se on valmis.
Graafikko voisi suunnitella oppaalle kansikuvan, logon ja muuta grafiikkaa. Laitoin vain jonkun hassun logon.
Python-koodista olisi hyvä tehdä Jupyter Notebook -versiot. Lukijat voivat sitten ajaa ne lokaalisti tai vaikka Google Colabissa. Jupyter Notebooksit siis ovat GitHubissa ja oppaassa on linkki niihin. Juuri Jupyter Notebooksien vuoksi GitHub olisikin luontevin kirjoitusalusta.
Kai GitHub-repon Issues, Discussions ja Projects riittää tällaisen kirjoitusprojektin organisoimiseen? Ei kai tähän tarvitse mitään muuta?
Booksprint-tyyppisiä kirjoitussessioita voidaan järjestää joko livenä tai etänä, jos osallistujia kiinnostaa kollaboratiivinen kirjoittaminen tuolla tasolla.
Lisäksi oppaan pohjalta voidaan järjestää työpajoja joko livenä tai etänä.
Tämä ei välttämättä ole kovin oikeaoppista open sourcea, mutta tein oppaan videoita varten YouTube-kanavan. Videoita siis ei embeddata oppaaseen vaan niihin on vain linkki. Jos on YouTubea oikeaoppisempi vaihtoehto niin voi ehdottaa. Vimeo olisi kai periaatteessa oikeaoppisempi.
Booksprinttien striimaaminen livenä on niin kutkuttava idea että tein sitä varten projektille Twitch-kanavan. Tämäkään ei ole oikeaoppinen valinta, jos keksii paremman vaihtoehdon niin sopii ehdottaa.
Tämä on todella arveluttava valinta, mutta tein nyt testiksi Telegram-kanavan reaaliaikaista viestintää varten. Saa taas ehdottaa oikeaoppisempaa vaihtoehtoa jos keksii sellaisen.
Voi olla että asentelen tuonne data-aktivismi.online-domainiin oppaassa mainittuja ohjelmia, mutta ne ovat sitten siellä demona eikä kannata luottaa siihen että jaksaisin ylläpitää niitä pidemmällä tähtäimellä.
Jos tahdot osallistua kirjoitusprojektiin, ota yhteyttä!
Tomi Toivio
Open Source Coordinator
+358400604828
#avoinLähdekoodi #booksprint #dataAktivismi #JupyterNotebook #kansalaisjournalismi #Python #YouTube
https://data-aktivismi.online/2023/09/kirjoitusprojektin-suunnittelua/
-
Tämä blogi on osa projektiani avata suomenkielinen FLOSS Manuals -opaskirjasto uudelleen. Projekti oli muutaman vuoden arkistoituna mutta nyt on selvästi tarve kirjoittaa suomenkielistä dokumentaatiota nimenomaan suomalaisen kansalaisyhteiskunnan tarpeisiin. Tahdon käsitellä oppaassa ainakin kahta mielestäni ajankohtaista ja tärkeää teemaa.
Ensinnäkin hallitusta horjuttanut kansalaisjournalistien tiedonharavointi. Tähän olisi ollut paljon avoimen lähdekoodin työkaluja, mutta tietääkö kukaan niiden olemassaolosta ja osaavatko kansalaisjournalistit käyttää niitä ilman ohjeita? Tällaisella tiedonharavoinnilla tai avointen lähteiden tiedustelulla (OSINT) on kansalaisyhteiskunnan voimaannuttamisen lisäksi myös turvallisuuspoliittista merkitystä, vapaaehtoisten OSINT-ryhmien toiminta on ollut erittäin tärkeää esimerkiksi Ukrainan sodassa. Eli tarjotaan ohjeet tällaisen tutkimustyön työkalupakkiin.
Toinen teema on syväoppimisen nopea kehitys ja se seikka että suomenkielistä tekstiä on aina ollut erittäin vaikeaa käsitellä luonnollisen kielen prosessoinnin (NLP) työkaluilla. Nykyisin Pythonin Spacy-kirjasto ymmärtää suomea ja TurkuNLP on julkaissut suomenkielisen GPT-mallin. Mielestäni tätä pitää kartoittaa oppaassa ja olen kirjoittamassa aiheesta myös journalistista artikkelia Kulttuurivihkoihin. Onko siis suomenkielinen kulttuuri näivettymässä tekoälyn aikakaudella vai onko meillä jo työkalut suomenkielistä tekoälyä varten? Eli tee se itse -ohjeita suomenkielisen tekoälyn käyttöön.
Muita teemoja ovat esimerkiksi tiedonlouhinnan etiikka eli yksityisyyden suojan huomioiminen. Henkilötiedot tulee poistaa jos vaikkapa kerätään keskustelupalstoilta vanhoja keskusteluja. Tiedonlouhintaan voi liittyä esimerkiksi tekijänoikeuksiin ja lainsäädäntöön liittyviä rajoitteita, osaa avoimen lähdekoodin työkaluista voi helposti käyttää epäeettisesti. Tällä tarkoitan sitä että epäeettiset tahot ottavat samankaltaisilla työkaluilla jatkuvasti talteen kaiken internetissä olevan tiedon etiikasta välittämättä, mutta meidän täytyy toimia eettisesti.
Tämän kansalaisjournalismin aallon vuoksi olen muistellut 20 vuotta sitten pyörinyttä suomenkielistä Indymediaa, joka oli aikaansa edellä oleva kansalaisjournalistien tietotoimisto. Tuolloin demokraattinen päätöksenteko postilistalla oli hyvin vaikeaa. Mitkä työkalut sopisivat parhaiten data-aktivistien demokraattiseen yhteistyöhön verkossa, olisiko vastaus yksinkertaisesti käyttää samoja menetelmiä kuin avoimen lähdekoodin ohjelmistoprojekteissa, eli kanban käyttöön? Tutkimustyökalujen lisäksi täytyy tarkastella yhteistyöhön ja tuloksien julkaisuun tarvittavia työkaluja. Ehkä itse kirjoitusprojektin voi organisoida näillä samoilla työkaluilla.
Ajattelin että opas olisi englanniksi Research Tools For Activism, mutta en keksi hyvää suomennosta. Olkoon työnimi toistaiseksi Data-aktivistin opas, olen tosiaan itse kiinnostunut ensisijaisesti tutkimustyökaluista, mutta mukaan saa tuoda muitakin kansalaisyhteiskunnan tarvitsemia avoimen lähdekoodin työkaluja. Opas voisi olla kuin työkalupakki josta voi valita sopivat työvälineet.
FLOSS Manualsin uusi kollaboratiivinen kirjoitusalusta on BookStack koska Booktypeä ei kehitetä enää. Tehokkain tapa oppaan kirjoittamiseen on hackathonin kaltainen intensiivinen kirjapyrähdys. Etsin nyt yhteistyötahoja kirjoitusprojektia varten. Lisäksi olen kiinnostunut mahdollisuudesta järjestää aiheesta työpajoja. Voi myös olla että asentelen palvelimelleni demokäyttöön oppaassa mainittuja ohjelmia, mutta ne ovat sitten koekäyttöön eikä niiden pysyvyyteen saa luottaa.
Olen myös pohdiskellut että vuonna 2023 oppaaseen pitäisi linkittää havainnollistavia videoita ja koodinäytteet tulisi laittaa GitHubiin Jupyter Notebook -muodossa. Tässä mielessä konseptia voisi kehittää painetusta kirjasta enemmän interaktiivisen multimedian suuntaan. Toisaalta tekstin pitäisi olla etusijalla, koska kyseessä ei ole FLOSS Videos. Oppaan voisi myös kirjoittaa kokonaan GitHubissa. Tätä täytyy vielä miettiä.
Vastuuvapauslausekkeena sanon että teen tätä blogia ja FLOSS Manualsia palkattomana vapaaehtoistyönä koska se on velvollisuuteni kansalaisaktivistina ja lisäksi todella mielenkiintoista. Toteutan kuitenkin vastaavia kaupallisia avoimen lähdekoodin projekteja Osuuskunta Sangen jäsenenä. Itse asiassa tämä ei ollut vastuuvapauslauseke vaan ovela mainos.
Mutta katsotaanpas mitä tästä tulee. Jos olet kiinnostunut osallistumaan niin sähköpostiosoitteeni on [email protected].
#avoinLähdekoodi #avointenLähteidenTiedustelu #booksprint #dataMining #dataScience #dataAktivismi #datatiede #FLOSSManuals #GitHub #GPT #hackathon #JupyterNotebook #kansalaisjournalismi #kirjapyrähdys #NLP #OSINT #OsuuskuntaSange #Python #Spacy #suomenkielinen #Suomi #syväoppiminen #tekoäly #tiedonharavointi #TurkuNLP #UkrainanSota #webScraping #yksilönsuoja