Der Public Interest Podcast - mit Technologien für eine bessere Welt

Der Public Interest Podcast - mit Technologien für eine bessere Welt

Transkript

Zurück zur Episode

00:00:11: Hallo und herzlich willkommen zum Public Interest Podcast. Ich bin Feli.

00:00:14: Hallo und ich bin Joram.

00:00:16: Gemeinsam arbeiten wir im Prototype Fund.

00:00:17: Hier im Prototype Fund fördern wir Einzelpersonen und kleine Teams und unterstützen

00:00:21: sie dabei, ihre Open-Source-Software-Ideen in Prototypen umzusetzen.

00:00:25: In dieser Staffel mit dem Thema Up and Coming sprechen wir mit diesen Menschen

00:00:28: darüber, wie sie zur Open-Source-Software-Entwicklung gekommen sind.

00:00:31: In dieser Folge geht es um den Quereinstieg. Also Menschen, die eigentlich was

00:00:35: anderes als Softwareentwicklung gelernt haben, jetzt aber genau dort gelandet

00:00:39: sind. Wir sind übrigens auch Quereinsteiger.

00:00:42: Ich zum Beispiel habe ja eigentlich mal Biologie gelernt und bin dann über so

00:00:46: ein paar Umwege zum Thema Open Source gekommen und das war auch nicht mal alles

00:00:50: leicht und ich habe auch nicht mal alles gleich verstanden,

00:00:52: aber es war immer interessant und ich glaube so ein bisschen hat es auch geholfen,

00:00:56: dass ich mit einer anderen Perspektive darauf blicken konnte.

00:00:59: Und ich studiere eigentlich Kulturwissenschaften und bin da nicht so oft mit

00:01:02: Open Source in Kontakt gekommen, mit Big Blue Button schon, das war's.

00:01:06: Ich durfte schon super viel Lärm im Projekt empfangen, also durch den Kick-Off,

00:01:09: durch die Demo-Days, aber Coden kann ich halt einfach immer noch nicht.

00:01:13: Ich finde es so spannend und frage mich halt, wenn ich Coden könnte,

00:01:15: was ich da für ein Projekt umsetzen würde.

00:01:18: Und weil uns das so interessiert, haben wir uns sehr darüber gefreut,

00:01:21: über das Thema Quereinstieg zu sprechen und da haben wir uns mit Laura Lübbert verabredet.

00:01:25: Sie ist Biologin und ist im Laufe ihrer Studien von Single-Cell Transcriptomics,

00:01:31: das ist natürlich für mich als Biologe spannend, aus dem Labor zu einem Rechner gewechselt.

00:01:35: Als Bioinformatikerin hat sie dann optimierte Analyse-Pipelines für diese sehr

00:01:39: komplexen Datensätze entwickelt und hat dann auch noch ein Tool geschrieben.

00:01:44: Das Tool heißt GGET und das konnte sie auch als wissenschaftliche Publikation

00:01:48: veröffentlichen und eben als Open-Source-Tool.

00:01:51: Wir haben sie remote getroffen und meine erste Frage an sie war,

00:01:55: welche Rolle spielt Open-Source-Software für dich in der Forschungsarbeit?

00:01:59: Ja, ich kann natürlich vor allem zu meinem Gebiet der Biologie sprechen und gerade in der Biologie,

00:02:08: generieren wir in den letzten Jahren immer mehr, immer größere Datensets.

00:02:13: Es wird immer kostengünstiger und immer effizienter, große Daten zu generieren. Und die ...

00:02:19: Es handelt sich um Hunderte von Gigabytes oder sogar Terabytes an Daten,

00:02:23: die kann man nicht mehr mal eben in Excel schmeißen. Da braucht man spezielle

00:02:28: Software in den meisten Fällen.

00:02:30: Oft, die von den Forschern selber geschrieben wird, um diese Daten zu analysieren.

00:02:36: Und darum ist es gerade jetzt so wichtig, dass mit dem Datenset auch die Software bereitgestellt wird,

00:02:44: weil es mehr als je die Software ein großer Teil von dem Endresultat ist,

00:02:52: weil man sich die rohen Daten so wie früher gar nicht mehr angucken kann.

00:02:55: Da ist ja auch so ein bisschen dein Tool, ein Werkzeug, was dabei hilft.

00:02:59: Darauf kommen wir dann gleich zu sprechen. Aber vorher würde mich interessieren,

00:03:02: Wir reden ja hier viele jetzt in dieser Folge über Quereinstieg in Open-Source-Software-Entwicklung.

00:03:07: Leute, die nicht klassische Entwickler oder EntwicklerInnen-Karrieren hinter

00:03:12: sich haben und dann bei Open-Source-Software gelandet sind.

00:03:14: Und deswegen würde mich interessieren, wie war das denn bei dir?

00:03:16: Du bist ja von der Laborbank,

00:03:18: von dem, was man so Wetlab nennt, vom quasi klassischen Experimentieren im Labor

00:03:22: hin zur Bioinformatik gewechselt und dann von der Bioinformatik,

00:03:26: ich weiß nicht, ob das ein großer Schritt dann noch war, hin zur Open-Source-Software-Entwicklung,

00:03:30: dass du jetzt Open-Source-Software-Entwicklerin bist. Wie war denn für dich dieser Weg?

00:03:34: Ja, also erstmal von der Laborbank zur Bioinformatik.

00:03:40: Ich hab ja mein Bachelor und Master an der Uni Leiden gemacht.

00:03:45: Und während meines Bachelors und Masters hab ich eigentlich überhaupt kein Programmieren

00:03:48: gelernt. Das war nicht wirklich Teil des Curriculums.

00:03:51: Und das war etwas, was ich unbedingt während meines PhDs nachholen wollte.

00:03:56: Und das war auch Teil, warum ich mir Caltech ausgesucht habe.

00:04:00: Es ist bekanntlich eine sehr technische Universität.

00:04:03: Und ich dachte, da kann man bestimmt gut Programmieren lernen.

00:04:06: War auch so. Also ich habe am Anfang meines PhDs an der Laborbank angefangen,

00:04:12: bin dann aber immer weiter in Richtung Bioinformatik gerutscht.

00:04:16: Und mir ist halt aufgefallen, dass da halt eine Nische ist, in der ich sehr

00:04:21: gut reinpasse mit meinen Fachkenntnissen in der Genetik.

00:04:25: Und dann eigentlich von der Bioinformatik zur Open Source, ja,

00:04:29: hast du schon gesagt, war eigentlich kein großer Schritt.

00:04:33: Also unser Hauptprodukt, mein Hauptprodukt jetzt ist mein Code,

00:04:37: meine Software und ich will natürlich,

00:04:39: dass die der Community und auch der Öffentlichkeit bereitgestellt wird.

00:04:44: Also für mich, meine Bioinformatik war immer Open Source und das sollte,

00:04:48: also ich finde auch, dass das sollte, sollte so sein, sollte gar nicht getrennt sein.

00:04:52: Da können wir gleich mal darauf zu sprechen kommen, was du denn entwickelt hast.

00:04:55: Du hast Gget, ist das richtig ausgesprochen?

00:04:57: Ja, das ist richtig.

00:04:58: Genau, Gget entwickelt. Das ist ein Tool. Was macht denn das eigentlich genau?

00:05:03: Ja, also GGET ist ein Programm, das gezielt Daten aus großen genomischen Datenbanken holt.

00:05:12: Und was bedeutet das oder warum brauchen wir das?

00:05:16: Also in meiner Forschung arbeite ich viel mit DNA und RNA-Sequenzen.

00:05:22: Und ich muss also meine neuen Sequenzen, um die zu identifizieren,

00:05:26: mit bekannten Sequenzen vergleichen.

00:05:31: Und diese Sequenzen, zum Beispiel für den Menschen, werden auf großen,

00:05:34: genomischen Datenbanken zur Öffentlichkeit bereitgestellt.

00:05:41: Also, diese Datenbanken sind öffentlich, das ist schon mal sehr gut.

00:05:44: Aber es handelt sich natürlich um sehr viele Informationen.

00:05:48: Ich brauch die Sequenz, ich brauch die genetische Information.

00:05:51: Ich brauch Informationen zur Transkription, zur Translation,

00:05:56: bis hin zum Protein, bestimmte Sequenzen.

00:05:59: Stehen für mehrere Proteine, also es handelt sich wirklich um sehr,

00:06:04: sehr vielfältige Informationen, die man sich von vielen verschiedenen Seiten

00:06:09: angucken kann und diese Informationen sind auf verschiedene Datenbanken verteilt und jede Datenbank,

00:06:16: jede Organisation, jede Firma hat halt irgendwo ihr Spezialgebiet und es gibt

00:06:23: ein bisschen Überlappung zwischen den Datenbanken, aber halt auch viel neue

00:06:27: Informationen, je nachdem, welche Datenbank du dir jetzt genau anguckst.

00:06:31: Und G-GET! fasziniert halt. Du kannst zum Beispiel G-GET!

00:06:38: Ein Gen geben und GIGETT zieht dann alle Informationen zu diesem Gen aus allen

00:06:43: Datenbanken gleichzeitig.

00:06:46: Und dann kannst du die Informationen vergleichen. Das ist auch immer wichtig.

00:06:52: Bei manchen Genen sind die Datenbanken sich nicht so sicher.

00:06:55: Das sieht man oft, dass verschiedene Datenbanken was anderes sagen.

00:06:58: Das ist sehr wichtig, um dann zu wissen, mit welchen Kenntnissen gehst du dann

00:07:03: weiter, welche Kenntnisse nimmst du in dein Endergebnis mit rein.

00:07:07: Und das hilft dann auch, dass andere Leute das nachvollziehen können,

00:07:10: wo du deine Kenntnisse her hast.

00:07:13: Und ich glaube, das kann man so ein bisschen vergleichen mit Trivago.

00:07:17: Trivago ist ja eine Hotel-Metersuche und G-GED ist eine Gen-Metersuche,

00:07:21: dass man die Information zu dem Gen von allen Datenbanken gleichzeitig kriegt und vergleichen kann.

00:07:28: Ich bin selber auch Biologe und dementsprechend neugierig. Mich würde noch interessieren,

00:07:32: technisch, wie hast du das gelöst, dass diese Gene, die in Datenbanken unterschiedliche

00:07:37: Namen haben, dass du die miteinander verknüpft bekommst.

00:07:40: Das ist vielleicht was, was auch für andere EntwicklerInnen relevant sein kann.

00:07:43: Man hat öfter mal mit Datenbanken zu tun, wo die Informationen zum gleichen

00:07:47: Ding sind, aber jeder hat eine andere Referenz dafür.

00:07:51: Ja, absolut. Ich würde auch sagen, das war das Hauptproblem,

00:07:54: das ich lösen musste. Das war am schwersten.

00:07:58: Und ich hab jetzt erst mal ...

00:08:02: Ich hab sozusagen eine Datenbank, also eine ID als Ausgangspunkt ausgesucht.

00:08:10: Also so ziemlich die größte Datenbank der Standard.

00:08:15: Ich habe gesagt, okay, mit den IDs fangen wir an.

00:08:19: Und das ist schon mal wichtig, weil dann fängst du schon mal nur mit einer ID an.

00:08:24: Und dann die eine ID zu den ganzen verschiedenen Datenbanken zu verknüpfen.

00:08:29: Ja, es war je nach Datenbank einfach oder nicht so einfach.

00:08:35: Manche Datenbanken waren da sehr hilfreich. Die hatten schon bestehende APIs.

00:08:39: Also, da musste ich nur den API-Call richtig aufbauen.

00:08:43: Für andere Datenbanken war es nicht so einfach. Teilweise gab es dann Third-Party-Tools,

00:08:49: die dann irgendwie probiert haben, die IDs zu verknüpfen.

00:08:53: Also, manchmal hab ich auch diese Third-Party-Tools mit eingebaut.

00:08:56: Das ist natürlich schwer, die muss man dann auch noch mal kontrollieren,

00:08:59: gucken, dass das alles stimmt, dass auch wirklich alle Ergebnisse eingebaut

00:09:03: werden, dass die Tools weiterhin unterhalten werden.

00:09:05: Da sprechen wir auch, das ist natürlich auch Teil des Open-Source-Problems.

00:09:11: Und ja, es war ein großes Problem und es gibt leider nicht ...

00:09:14: Eine Lösung, also es war sehr viel Puzzeln mit den Bausteinen,

00:09:20: die ich hatte, um dann ein Endergebnis zu kriegen, was irgendwie die Informationen

00:09:25: von allen Datenbanken holt.

00:09:26: Und dann hast du deine Ergebnisse veröffentlicht in einem wissenschaftlichen Journal,

00:09:30: das ist für WissenschaftlerInnen immer so der wichtigste oder ein sehr wichtiger

00:09:36: Punkt, weil das Karrieren ermöglicht, weil man dann Zitationen bekommen kann.

00:09:43: Aber was war denn für dich schwieriger, die Publikation in das Journal zu bekommen

00:09:47: oder den Code vorzubereiten für eine Open-Source-Veröffentlichung,

00:09:50: sodass andere Menschen das lesen können und damit weiterarbeiten können?

00:09:54: Ja, also G-GET war immer auf GitHub gehostet, also es war eigentlich immer Open-Source.

00:10:00: Ich hab direkt von Anfang an, war es öffentlich, von Anfang an hätten andere

00:10:05: Leute das benutzen können.

00:10:07: Was für die Open-Source-Veröffentlichung sehr viel Zeit und Arbeit gekostet

00:10:11: hat, war vor allem die Dokumentation und die Tutorials.

00:10:15: Das war mir sehr, sehr wichtig, auch im Namen von Accessibility.

00:10:21: Also, dass auch Anfänger G-GAP benutzen können, dass es ganz klar ist,

00:10:25: wie man das installiert, wie man das benutzt.

00:10:29: Für jede Art der Benutzung, die ich mir ausdenken konnte, habe ich ein Tutorial gebaut.

00:10:35: Also das hat natürlich sehr viel Arbeit und Zeit gekostet, war mir aber sehr,

00:10:39: sehr wichtig und ist auch etwas, was ich gerne mehr sehen wollte in der Open-Source-Community.

00:10:44: Die Publikation, also Jiget wurde ja im Journal Bioinformatics als Application Note publiziert.

00:10:53: Und so eine Application Note ist eigentlich ein sehr kurzes Paper, es ist nur zwei Seiten.

00:10:59: Und in den zwei Seiten steht drin, was ist das Programm, wofür,

00:11:03: denke ich, das Leute es benutzen können. Und es geht bei der Publikation vor

00:11:07: allem darum, die Community wissen zu lassen, dass das Programm jetzt besteht.

00:11:12: Und dass du halt Peer Reviewers, also Gutachter, andere Forscher hast,

00:11:17: die sich das Programm angucken und sagen, ja, wir finden das okay so,

00:11:21: das kann jetzt so von der Community akzeptiert werden.

00:11:25: Also, das Paper selber zu schreiben, war jetzt nicht so schwer,

00:11:27: Das ist ja nur eine Beschreibung von dem Programm, was ich monatelang geschrieben

00:11:32: habe und das ich natürlich sehr, sehr gut kannte.

00:11:36: Allerdings, so wie der Peer-Review-Prozess im Moment funktioniert, Also...

00:11:44: Es wird erwartet, dass Forscher ohne Bezahlung in ihrer Freizeit für das Journal

00:11:50: irgendwelche Papers lesen und Feedback geben, was natürlich sehr, sehr viel Arbeit ist.

00:11:55: Und was bei meinem Paper passiert ist, ist, dass das Journal ein halbes Jahr

00:11:59: lang keine Reviewer gefunden hat.

00:12:02: Und das passiert gerade jetzt und auch während der Pandemie sehr, sehr viel.

00:12:07: Und das kann man dem Forschern ja auch gar nicht übel nehmen,

00:12:10: schon eigentlich Ausbeutung der Journals und ich glaube, wir könnten einen ganzen

00:12:13: Podcast füllen über die Probleme mit dem jetzigen Peer-Review-System.

00:12:19: Aber das war so eigentlich das größte Problem während der Publikation,

00:12:24: dass es so lange gedauert hat, bis das Journal Gutachter gefunden hat.

00:12:32: Aber als die Reviews einmal da waren, sie waren sehr positiv und dann ging es

00:12:36: auch alles sehr schnell.

00:12:37: Glaubst du, dass das Problem mit den GutachterInnen ein spezifisches Problem

00:12:41: war, weil es um diese Open-Source-Software geht, die diesen speziellen Fokus

00:12:47: hat, oder ist es ein allgemeines Problem, was man woanders auch hat?

00:12:52: Weil mir ist es noch nicht so super häufig untergekommen, dass quasi die GutachterInnen

00:12:56: knapp sind, aber ich habe auch nicht im Bereich Bioinformatik Erfahrungen gesammelt.

00:13:00: Deswegen würde mich interessieren, ob das was ist, was häufiger vorkommt.

00:13:05: Ich glaube schon, dass es etwas ist, was häufiger vorkommt.

00:13:10: Also nicht nur in der Biologie, sondern in allen Bereichen der Forschung.

00:13:14: Also ja, gerade in der Pandemie habe ich sehr viel gehört von anderen ForscherInnen,

00:13:23: dass deren Papers einfach nicht reviewed wurden, weil keine GutachterInnen gefunden wurden.

00:13:29: Wie ist es denn mit dem Support von deiner Software? Ich hab so ein bisschen

00:13:33: recherchiert im Vorfeld, was Open-Source-Software bedeutet in der Wissenschaft

00:13:37: oder in der akademischen Welt.

00:13:40: Und das, was sehr häufig genannt wurde, ist, dass ForscherInnen sich davor fürchten,

00:13:45: so viel Supportanfragen zusätzlich noch zu tun zu haben.

00:13:49: Denn neben ihrem Forschungsalltag und dem sozusagen, was du grade gesagt hast,

00:13:53: der freien Arbeit, die sie eh noch machen müssen für die Journals,

00:13:56: was quasi Teil des Wissenschaftssystems ist, dann auch noch Software-Support

00:14:00: zu machen, zu entschlossen hat, seine Software zu teilen, schreckt viele Menschen

00:14:05: ab. Was ist da deine Erfahrung?

00:14:07: Ja, ich glaube, es gibt...

00:14:09: Hier zwei Seiten zu dem Problem. Wenn man seine Software veröffentlicht,

00:14:14: dann stellt man die natürlich auch ...

00:14:16: Offen für alle, die zu lesen. Und man stellt die auch ...

00:14:20: Ja, man stellt die für Future Requests, also neue Entwicklungen offen, aber auch zur Kritik.

00:14:28: Und ich glaube, das kann schon sehr unheimlich sein. Und ich finde auch,

00:14:33: dass es unsere Community ... dass die Aufgabe von unserer Community dafür zu

00:14:37: sorgen, dass die Kritik immer konstruktiv ist und dass immer respektvoll miteinander umgegangen wird.

00:14:43: Sowohl in der Kritik als auch in Future Requests.

00:14:46: Und dass da halt auch das Bewusstsein da ist, dass das nicht der Vollzeitjob

00:14:51: ist, von der Entwicklerin dieses Programm zu unterhalten.

00:14:56: Und dass da Wertschätzung und Dankbarkeit im Spiel ist.

00:15:02: Zu den Future Requests, ich bin ein bisschen überrascht zu hören,

00:15:05: dass Leute das als negativ empfinden, eigentlich ein großer Pluspunkt von Open Source,

00:15:10: dass man eine Community aufbaut, dass man zum Beispiel durch GitHub-Issues ein

00:15:16: System hat, wo Leute um neue Features fragen können oder selber einbauen kann.

00:15:24: Und ich finde auch gar nicht, dass die Aufgabe der Entwicklerin ist,

00:15:30: die Features dann reinzubauen,

00:15:32: sondern halt die Open-Source-Community dann reinspringen kann und dass es sehr

00:15:38: schön ist, dass eigentlich alle mit ihren speziellen Fachkenntnissen dann zu

00:15:42: den Programmen beitragen können.

00:15:44: Also du siehst das eher als eine Bereicherung an, dass so Leute sagen,

00:15:48: hey, schau mal, hier kann man noch was verbessern als Stressfaktor.

00:15:53: Ja, auf jeden Fall. Also solange halt das Bewusstsein da ist,

00:15:58: dass es dann nicht die Aufgabe ist der Entwicklerin, das wirklich so zu machen

00:16:03: und dass halt da mit Respekt und Dankbarkeit mit umgegangen wird, auf jeden Fall.

00:16:08: Und wie viel Unterstützung hast du erhalten aus deiner Forschungsgruppe für

00:16:12: die Softwareentwicklung und auch dann eben bei dem Streben, das Ganze zu dokumentieren

00:16:17: und frei verfügbar zu machen?

00:16:18: Ja, also GGET hat angefangen als etwas, was ich für mich selber geschrieben

00:16:25: habe, aus Frustration eigentlich.

00:16:29: War total genervt, immer wieder durch verschiedene Browser durchzuklicken und zu versuchen,

00:16:35: in der Navigation von den Datenbanken jetzt meine Informationen zu finden.

00:16:45: Dazu muss ich ja was sagen.

00:16:48: Ich hab dann irgendwann in einer Präsentation Jiget erwähnt vor meiner Gruppe.

00:16:53: Und das kam halt irgendwie einfach so auf. Und dann meinte mein Professor meine

00:16:58: Gruppe halt, ach, wart mal, erzähl uns

00:16:59: mal mehr darüber. Und so hab ich herausgefunden, dass der Bedarf da ist.

00:17:05: Also, es war mir vorher noch überhaupt nicht wirklich bewusst,

00:17:08: dass das so nützlich sein könnte für so viele andere Leute, die dasselbe Problem haben.

00:17:14: Und dann hat halt vor allem mein Professor, Lia Pachter, mir geholfen,

00:17:18: das Programm in die endgültige Version, die wir heute kennen,

00:17:22: zu bringen und hat mir auch geholfen, das Paper zu schreiben.

00:17:28: Und ich habe das Glück, mit sehr, sehr brillanten, sehr, sehr hilfsbereiten

00:17:32: Leuten zu arbeiten in meiner Gruppe.

00:17:36: Also selbst wenn die jetzt nicht direkt involviert waren in G-GET,

00:17:41: glaube ich schon, dass eine positive Arbeitsumgebung Und in der man sich unterstützt

00:17:47: und gefördert fühlt, dass es sehr, sehr wichtig ist für die Produktivität.

00:17:51: Und in dem Sinne haben sie mir sehr geholfen.

00:17:53: Ja, gibt es auf der anderen Seite irgendwelche Herausforderungen in der Open

00:17:57: Source Software Entwicklung, die spezifisch sind fürs akademische Umfeld?

00:18:01: Hast du genügend Zeit dafür gehabt oder siehst du das andere?

00:18:05: Vielleicht, ich meine, es klingt ja so, es ist in deiner Forschungsgruppe insgesamt

00:18:09: schon eine sehr angenehme Atmosphäre.

00:18:10: Aber siehst du, dass es vielleicht in anderen Forschungsgruppen an Ressourcen mangelt,

00:18:14: an Zeit mangelt oder auch an Wertschätzung dafür,

00:18:17: sich überhaupt neben dem quasi dem Ziel, ich möchte jetzt hier eine biologische

00:18:21: Frage beantworten und ein Paper rauskriegen, sich dabei auch noch darum zu kümmern,

00:18:26: dass das Werkzeug, was man dabei benutzt, vielleicht sinnvoll dokumentiert und veröffentlicht ist?

00:18:31: Ja, auf jeden Fall. Also, ich glaube, die Wertschätzung fehlt da und auch das Bewusstsein,

00:18:38: wie viel Zeit das wirklich kostet und wie schwer das ist, ein Programm in eine

00:18:44: Form zu kriegen, dass andere Leute das nachvollziehen und benutzen können.

00:18:48: Also ich glaube, ja, das Bewusstsein fehlt da und damit halt auch die Wertschätzung dafür.

00:18:53: Und dann würde ich mich gerne noch mal beim Prototype bedanken,

00:18:56: weil ich glaube Initiativen wie Prototype sind ein sehr, sehr guter Anfang,

00:19:00: um diese Wertschätzung und Vergütung aufzubringen.

00:19:05: Ich finde es auf jeden Fall sehr wichtig, dass wir hoffentlich in der Zukunft

00:19:09: zu dem Punkt kommen, Boah.

00:19:13: Die Veröffentlichung des Programms in einer Form, dass es mindestens für andere

00:19:17: lesbar ist, ein ganz normaler Teil der Paper-Publikation ist.

00:19:23: Also, dass es ohne überhaupt nicht geht.

00:19:27: Und ... ähm ... dann ... ja, genauso wie man jetzt ... Man publiziert ja sein

00:19:32: Paper nicht ohne Message-Section.

00:19:36: Also, niemand würde sagen, ach, warum vergräulichst du dir denn deine Zeit,

00:19:40: seine Message-Section zu schreiben? so sollte es ein ganz normaler Teil der

00:19:44: Forschung und der Publikation sein, seinen Code bereitzustellen.

00:19:47: Dann ein anderer Punkt, den ich auch in meiner Recherche so immer wieder gefunden

00:19:51: habe, ist das Problem der Reproduzierbarkeit.

00:19:54: Und das hast du ja auch schon so ein bisschen angesprochen, aber ich würde gerne

00:19:56: ein bisschen mehr darüber erfahren.

00:19:58: Reproduzierbarkeit für alle, die sich da nicht so im Thema auskennen,

00:20:02: ist das Problem, dass immer wieder Dinge veröffentlicht werden von einer Arbeitsgruppe

00:20:07: und dann versucht eine andere Arbeitsgruppe mit den gleichen Methoden das gleiche

00:20:10: Experiment nachzumachen und kann nicht das gleiche Ergebnis beobachten.

00:20:14: Und das ist natürlich dann ein Problem, wenn man veröffentlichte Daten als sozusagen

00:20:19: die Wahrheit, was auch immer das genau sein soll, sieht, weil man denen eben

00:20:23: weniger vertrauen kann.

00:20:24: Und da gibt es immer mehr Arbeitsgruppen oder immer mehr Diskurs,

00:20:28: sag ich eher, immer mehr Diskurs innerhalb der Forschung. Wie gehen wir damit

00:20:31: um mit dieser Reproduzierbarkeitskrise?

00:20:33: Und aus deiner Sicht können da Open-Source-Software und vielleicht auch so offene

00:20:37: Datenbanken, offene Datensets da ein Weg sein, aus dieser Reproduzierbarkeitskrise rauszukommen?

00:20:45: Ja, auf jeden Fall. Also, ich glaube, ohne offene Datenbanken und Open-Source-Code geht's gar nicht.

00:20:53: Also, ich glaube, das ist überhaupt erst

00:20:55: der erste Schritt, um aus dieser Reproduzierbarkeitskrise rauszukommen.

00:20:58: Also, unbedingt. Ohne Open-Source-Code und Daten wissen wir ja erstmal überhaupt

00:21:07: nicht, was denn reproduzierbar ist.

00:21:10: Wenn ich testen möchte, ob ein Resultat reproduzierbar ist, brauche ich den

00:21:14: Code und die Daten, sonst kann ich mein Resultat überhaupt nicht vergleichen

00:21:20: mit denen, die im Paper beschrieben würden.

00:21:24: Also ich würde sagen, ohne geht es gar nicht.

00:21:28: Ja, das ist für mich ein absoluter No-Brainer.

00:21:32: Ohne Open Source, Open Data kommen wir nicht aus der reproduzierbaren KS-Krise raus.

00:21:38: Und wie siehst du da den aktuellen Zustand? Findet das schon statt oder wird

00:21:42: das mehr, wird das besser?

00:21:43: Ja, also ich glaube, es gibt zum Glück immer mehr Bewusstsein.

00:21:48: Erstmal um die Reproduzierbarkeitskrise herum. Das Bewusstsein ist auf jeden Fall schon da.

00:21:54: Es gibt immer mehr Push, Daten und Code zu veröffentlichen.

00:21:58: Also viele Journals erlauben dir nicht mehr, dein Paper zu publizieren,

00:22:05: ohne dass du deinen Code veröffentlichst.

00:22:07: Das ist aber oft nicht genug, also oft wird überhaupt nicht geguckt,

00:22:13: in welchem Stand ist denn der Code, ist wirklich all der Code da?

00:22:18: Läuft der Code? Also da wird in der Peer Review im Moment eigentlich überhaupt nicht nachgeguckt.

00:22:23: Und das kommt dann erst später raus, wenn der Stand des Codes eigentlich überhaupt

00:22:31: nicht so ist, wie man das erwartet hätte.

00:22:36: Ein sehr gutes Beispiel von der Pandemie war das Programm CovidSim von Neil Ferguson.

00:22:42: Das war ein Programm, um halt die Epidemie zu modellieren.

00:22:47: Und das Programm wurde vor allem von England, von der Regierung benutzt.

00:22:52: Also die Ergebnisse wurden von der Regierung in England benutzt,

00:22:55: um die Covid-Response zu designen.

00:23:01: Also das Programm war wirklich sehr, sehr wichtig in deren Covid-Response-Information.

00:23:09: Und dann kam am Ende raus, dass das Programm überhaupt nicht läuft.

00:23:14: Es wurde eines von den buggiest programs ever beschrieben. Also es war ein Riesenproblem

00:23:20: und ja, der Code war immer da.

00:23:22: Also es war jetzt gar nicht so, dass der nicht veröffentlicht wurde.

00:23:25: Aber ja, die Regierung haben ihre Ergebnisse so angenommen, Bevor jemand geguckt

00:23:31: hat, läuft das dann überhaupt? Können wir das reproduzieren?

00:23:36: Und ja, also ich glaube, das Bewusstsein wird immer größer, aber...

00:23:42: Ja, wir sind auf dem richtigen Weg, wir sind noch nicht ganz da.

00:23:45: Gibt es was, was sich ändern müsste, damit Open Source Software Entwicklung

00:23:49: in der Wissenschaft einfacher wird, damit mehr Menschen ihren Code auch sauber veröffentlichen?

00:23:56: Ja, auf jeden Fall. Also ich glaube, ja, die Wertschätzung und Vergütung,

00:24:01: Prototype Fund nochmal, danke schön, die fehlt auf jeden Fall,

00:24:05: das können wir viel besser machen. Dazu kommt Ausbildung.

00:24:10: Also, ich find's eigentlich nicht akzeptabel, dass man heutzutage noch seinen

00:24:15: Bachelor oder Master in der Biologie machen kann, ohne jegliches Programmieren zu lernen.

00:24:21: Also, mit den Daten, mit denen wir heutzutage umgehen müssen,

00:24:25: das geht eigentlich nicht mehr.

00:24:29: Und dazu kommt, find ich, dass ... unsere Aufgabe als Community ist,

00:24:34: dann eine Umgebung zu schaffen, in der man lernen kann, in der man Anfänger

00:24:40: sein kann, in der man Fehler machen kann.

00:24:43: Dass halt die Motivation da ist, seinen Code zu veröffentlichen,

00:24:47: dass das Feedback willkommen ist, dass man da keine Angst haben muss,

00:24:51: da irgendwie respektlose Kommentare

00:24:55: zu kriegen, weil man halt nicht die Software-Engineerung-Ausbildung hat,

00:25:01: Aber dass da halt die Community für einen da ist, um zu helfen.

00:25:06: Das verbindet sich auch so ein bisschen mit dem nächsten Punkt, der mich interessiert.

00:25:11: Denn diese Wertschätzung innerhalb der Community ist ja auch innerhalb der Wissenschafts-Community

00:25:16: mitunter ein Problem. Also die Karrieren oder also eine Karriere im akademischen

00:25:21: Bereich ist sehr von Konkurrenz und Stress geprägt.

00:25:25: Wie würdest du das denn sehen? Ist es ein Vorteil oder Nachteil für die Karriere,

00:25:29: wenn man sich, also wenn man für die reine Forschungskarriere,

00:25:32: wenn man sich um die quelloffene Verteilung oder auch den Support von seiner

00:25:36: eigenen Software kümmert? Ja, also...

00:25:42: Im Moment ist die Wertschätzung, glaube ich, noch nicht da.

00:25:46: Also, ich glaube, es gibt sehr, sehr hohen Druck, um so schnell wie möglich

00:25:49: seine Ergebnisse zu produzieren.

00:25:52: Und da fällt das Saubermachen des Codes schon mal unter, auch, ja, mach ich später.

00:25:59: Oder sehr beliebt ist auch Code made available upon reasonable request.

00:26:05: Also, dass die Autoren dann sagen, kannst mich gerne nach dem Code fragen.

00:26:11: Ob der dann wirklich geschickt wird oder nicht, ist halt immer so eine Frage.

00:26:14: Und auch, gut, es ist halt dann immer noch kein Open-Source-Code.

00:26:19: Also, ja, ich glaube, das müssen wir in der Akademie auf jeden Fall besser machen.

00:26:24: Ich glaube, die Vorteile sind aber schon da.

00:26:28: Wenn dein Programm notsbar ist, dann kriegst du dafür auch Citations,

00:26:33: also Zitate, dass andere Leute sagen, ich habe dieses Programm benutzt.

00:26:37: Ich musste meine Analyse nicht noch mal von neu anfangen, weil ich auf die Ergebnisse

00:26:43: von dieser anderen Gruppe aufbauen konnte.

00:26:46: Und das ist natürlich für einen Forscher oder eine Forscherin das Beste,

00:26:52: was dir passieren kann. Dass andere Leute sagen, deine Forschung war nützlich.

00:26:56: Und ich hab darauf aufgebaut.

00:27:00: Und deine Glaubwürdigkeit als Forscher ist natürlich auch sehr wichtig.

00:27:03: Wenn deine Ergebnisse leicht reproduzierbar sind, hilft das,

00:27:07: leitt das Glaubwürdigkeit, was auch sehr, sehr wichtig ist.

00:27:12: Beide diese Sachen sind natürlich Langzeitziele.

00:27:17: Und also, die Belohnung ist nicht so direkt da, wie das Publizieren des Papers

00:27:24: wäre. Aber ich glaube, die Vorteile sind schon da. Und ich glaube ...

00:27:29: Ja, Leute ... Ja, Forscher und Forscherinnen, also grade auch in der Ausbildung

00:27:34: sollten wir mehr Nachdruck legen.

00:27:37: Dass die Vorteile schon da sind und dass es wirklich wichtig ist,

00:27:39: dass deine Forschung reproduzierbar ist und glaubwürdig und,

00:27:44: ja, dass es total schön ist, wenn andere Leute dein Programm benutzen.

00:27:50: Also jetzt mit G-GET sehe ich das ja auch, Leute benutzen das für Dinge,

00:27:53: die ich mir nie hätte ausdenken können, weil es ist überhaupt nicht mehr ein

00:27:57: Fachgebiet und das ist sehr, sehr cool zu sehen.

00:27:59: Wie geht es denn jetzt mit G-GET weiter? Du bist jetzt für sechs Monate gefördert

00:28:03: vom Prototype Fund, um das Programm weiterzuentwickeln und neue Funktionen hinzuzufügen.

00:28:08: Worauf freust du dich denn da am meisten in den nächsten sechs Monaten?

00:28:11: Beziehungsweise die sechs Monate haben ja schon angefangen. Also es sind jetzt

00:28:13: noch fünfeinhalb oder so fünf.

00:28:17: Ja, ja, erst mal nochmal vielen, vielen Dank für den Support.

00:28:22: Es freut mich sehr und ich freue mich am meisten auf die Community-Bildung.

00:28:27: Ich hatte es in der vorherigen Frage schon ein bisschen angesprochen.

00:28:33: Ja, wenn du ein Open-Source-Programm schreibst, dann öffnet das halt auch die

00:28:38: Tür für die Community, um darauf aufzubauen.

00:28:43: Und ich hab zum Beispiel jetzt letzte Woche einen Pull-Request auf GitHub gekriegt,

00:28:49: dass jemand eins von meinen G-GET-Modulen ausgebaut hat, dass man damit jetzt

00:28:54: nicht nur menschliche Gene finden kann, sondern auch Pflanzengene.

00:29:00: Und das ist natürlich total cool, ja.

00:29:03: Und da hätte ich selber überhaupt nicht dran gedacht. Da hab ich auch gar nicht

00:29:06: die Fachkenntnisse, um das so zu machen, dass es nützlich ist für andere Leute.

00:29:11: Aber dadurch, dass G-GET open source und gut dokumentiert ist,

00:29:15: konnte ein Wissenschaftler mit der Expektise ganz einfach das G-GET ausbauen,

00:29:24: dass das jetzt auch für Pflanzengene funktioniert.

00:29:30: Und diesem Community-Effort, Erweiterung von GIGETT durch die Community,

00:29:33: da würde ich sehr gerne mehr Fokus drauflegen.

00:29:37: Also ich habe jetzt letzte Woche detaillierte Contributing Guidelines geschrieben.

00:29:43: Also ich hoffe, dass das immer mehr funktioniert und ich glaube,

00:29:47: dass es eine der schönsten Sachen ist an Open Source Programmen,

00:29:52: wenn dann die Community wirklich anfängt, darauf aufzubauen.

00:29:56: Du hast ja jetzt konkret Zeit bekommen, dich um die Softwareentwicklung zu kümmern.

00:30:01: Wie reagiert da dein Umfeld drauf?

00:30:05: Ja, also meine direkte Forschungsgruppe findet das total super.

00:30:10: Wir sind natürlich alle große Fans von Open Source Software.

00:30:15: Das ist so ein bisschen, was wir machen.

00:30:18: Also das war gar keine Frage, dass es eine gute Idee ist, sich darum zu kümmern.

00:30:24: Und dass das auch sehr wichtig ist, dass das passiert.

00:30:30: Ich glaube auch, der Erfolg von G-GET spiegelt den Bedarf in der Community wieder.

00:30:36: Also das hat natürlich geholfen, dass das überhaupt keine Frage war,

00:30:39: ob der Bedarf da ist, ob es anderen Leuten wirklich hilft.

00:30:44: Also das hat mir in dem Fall sehr geholfen, dass ich habe sozusagen Daten,

00:30:49: um zu zeigen, nee, was ich mache, es ist schon wichtig,

00:30:53: das benutzen andere Leute, wäre vielleicht etwas schwieriger gewesen,

00:30:56: wenn es so ein bisschen unklar wäre, ob das, was ich jetzt mache wirklich nützlich

00:31:02: ist oder nicht, aber in dem Fall von G-GET.

00:31:06: War es ganz klar, die allgemeine Reaktion war positiv und meine Gruppe benutzt

00:31:14: G-GET auch sehr ausgiebig.

00:31:16: Also es ist auch für uns intern sehr wichtig, dass G-GET weiterhin gut läuft,

00:31:21: dass die Ergebnisse korrekt sind. Also es war gar keine Frage mehr.

00:31:25: Zum Schluss würde mich noch interessieren, was du anderen Menschen empfehlen würdest,

00:31:30: wenn die überlegen, in das Thema Open-Source-Software-Entwicklung einzusteigen,

00:31:34: die eben auch, weil sie vielleicht schon einen Bioinformatik-Hintergrund haben,

00:31:37: sich aber noch nicht so mit der Seite der Software-Veröffentlichung beschäftigt haben.

00:31:41: Gibt es da irgendetwas, was du selbst gerne gewusst hättest,

00:31:44: bevor du dich mit dem Thema auseinandergesetzt hast?

00:31:47: Ja, ich würde sagen, fang einfach an. Programmieren ist etwas,

00:31:52: was man sich relativ einfach selber beibringen kann.

00:31:56: Also es gibt sehr viele Online-Tools und Tutorials und Kurse,

00:32:01: die man sich gratis angucken kann.

00:32:05: Es fällt am Anfang immer sehr schwer. Also, es ist ganz normal,

00:32:09: wenn es total frustrierend ist am Anfang.

00:32:12: Das haben wir alle durchgemacht. Also, lass dich vor allem nicht unterkriegen.

00:32:18: Und ich würde vielleicht den Tipp geben, GitHub ist am Anfang vielleicht für

00:32:23: den Anfänger nicht ganz so klar, warum es so wichtig ist.

00:32:27: Aber ja, fang direkt an, all dein Code auf GitHub zu publizieren, zu unterhalten.

00:32:36: Dieses Version Control, dass man sehen kann, wann was passiert ist,

00:32:39: ist sehr, sehr wichtig in der Open-Source-Software-Entwicklung

00:32:42: oder in der Software-Entwicklung im Allgemeinen.

00:32:46: Und ich würde auch sagen, wenn du noch gar keine Idee hast, was du machen möchtest,

00:32:52: kann man sehr einfach in GitHub-Issues reingucken von bestehendem Programm, zum Beispiel GGET.

00:33:00: Ich hab jede Menge Future Requests, also Nachfragen von anderen Forscherinnen,

00:33:05: die gerne irgendwelche Weiterentwicklungen von GGET sehen würden.

00:33:10: Und ich hab da nicht immer Zeit für. Und da kommt halt dieser Community-Input,

00:33:14: ist da sehr, sehr willkommen.

00:33:17: Und wenn du als Anfänger dir so eine Issue raussuchst, dann weißt du schon genau,

00:33:21: das Programm besteht schon, das Programm hat eine Struktur, auf die du aufbauen

00:33:25: kannst und du weißt, dass was auch immer du machst, da ist ja Bedarf schon da,

00:33:30: weil jemand hat danach gefragt.

00:33:32: Und das ist eigentlich sehr cool, wenn du irgendwie anfangen möchtest,

00:33:36: weißt aber nicht so ganz, was du machen möchtest, guck dir die GitHub-Issues

00:33:40: an von deinem Lieblingsprogramm.

00:33:41: Es gibt bestimmt irgendwas und die Probleme variieren auch in Schwierigkeitsgrad.

00:33:48: Also da kann man sich ein bisschen aussuchen, was man machen möchte.

00:33:52: Und ich glaube, ich habe am Anfang auf jeden Fall nicht genug auf GitHub rumgeguckt.

00:33:59: Und ja, es ist ein bisschen ...

00:34:02: Ja, schwer zu navigieren am Anfang, aber es kommt dann doch schnell und ja,

00:34:06: lass dich vor allem nicht runterkriegen. Wir waren alle Anfänger.

00:34:10: Ach, und auch ganz wichtig, was ich oft höre, ist, warum soll ich dann überhaupt

00:34:17: lernen? Ich werde sowieso nie so gut sein wie der Software-Ingenieur mit 30 Jahren Erfahrung.

00:34:22: Das stimmt. Ich bin auch nicht so gut wie der Software-Ingenieur mit 30 Jahren Erfahrung.

00:34:27: Aber der Software-Ingenieur hat nicht deine Fachkenntnisse Und die Fachkenntnisse

00:34:32: oder Domain-Knowledge leiten dazu,

00:34:35: dass du etwas beitragen kannst, wo die Software-Engineers gar nicht dran gedacht haben.

00:34:43: Ja, da fehlte das Fachkenntnis. Und das, glaube ich, kann man mit G-Gate ganz klar sehen.

00:34:50: Es ist eigentlich so ziemlich mein erstes Programm, was ich je geschrieben habe.

00:34:55: Ich hab erst vor vier Jahren angefangen, zu programmieren zu lernen.

00:34:59: Und das hätte bestimmt ein Software-Ingenieur besser machen können.

00:35:05: Aber die Fachkenntnisse, die waren halt nicht da. Und ich wusste genau,

00:35:09: was Genetiker brauchen, wie sie mit dieser Software umgehen möchten.

00:35:14: Und das ist halt genauso wichtig wie das tatsächliche Programmieren am Ende.

00:35:21: Das war unser Gespräch mit Laura. Vielen Dank für das spannende Gespräch.

00:35:26: Es gibt auch Querenstücke aus anderen Bereichen. Viraja Kothoto ist der Gründer

00:35:30: und Direktor von Technology Solution for Human Rights.

00:35:32: Er ist ein internationaler und nationaler Menschenrechtsanwalt,

00:35:35: Flüchtlingsanwalt und Sozialunternehmer mit einem starken Hintergrund in humanitärer

00:35:39: Arbeit, Technologie und Recht.

00:35:41: Er hat selbst auch schon Open Source Software entwickelt. Er war nämlich Teil

00:35:44: der Förderung 012 und hat mit der Anwendung MyRights ein Werkzeug geschaffen,

00:35:48: mit dem Menschen Urteile zu Menschenrechten leichter durchsuchen und verstehen können.

00:35:52: Auch ihm haben wir ein paar Fragen gestellt und zuerst wollten wir von ihm wissen,

00:35:55: welche Rolle Open Source Software heute für JuristInnen spielt.

00:35:58: Miraj hat uns auf Englisch geantwortet und wir werden deswegen seine Antworten

00:36:01: danach noch einmal für alle auf Deutsch zusammenfassen.

00:36:04: In meiner Erfahrung habe ich nicht viele Fälle erlebt, in denen Open-Source-Software

00:36:09: in der legalen Welt oft benutzt wird.

00:36:10: Die meisten legalen Professionen verlassen ziemlich teure private Databasen,

00:36:15: die bis zu Tausende Tausend Dollar für ein jährliches Abkaufen kosten können.

00:36:20: Das bedeutet, dass NGOs, Nicht-Profit-Praktitioner oder Solo-Lehrer diese Databasen

00:36:24: nicht wirklich bezahlen können.

00:36:27: Aber in dem Sinne, dass es ziemlich gute freie Databasen gibt,

00:36:30: wie Worldly. Das ist eine fantastische Ressource und ich benutze sie oft.

00:36:34: Aber dieses Database ist nicht akzessibel, es ist nicht mit human-centered Design

00:36:39: Prinzipien designt und es ist nicht Open Source.

00:36:42: Laut Virage werde also Open Source Software nur selten von JuristInnen eingesetzt,

00:36:45: obwohl es einen eindeutigen Bedarf gäbe. Denn professionelle Software sei sehr teuer.

00:36:50: Es gäbe auch kostenlose Alternativen, so wie Worldly, die Virage selbst auch schon eingesetzt habe.

00:36:55: Laut Virage ist das Problem auch selten, dass Wissen oder Werkzeuge für freie

00:36:58: Software fehlen. In akademischen Papern gäbe es einen Haufen Fachwissen.

00:37:31: Wir wissen, dass sie extrem vertrauensvoll sind, um Texte zu summarisieren,

00:37:34: legale Ergebnisse zu prädiktieren und relevante legale Informationen zu erwerben.

00:37:39: All diese Methoden würden einem legale Text mehr erreichbar machen.

00:37:43: Viraj sagt, wie so oft scheitere es also an der Umsetzung. Die Technologie braucht

00:37:47: nur eine sinnvolle Oberfläche für die Benutzung, damit auch tatsächlich alle

00:37:51: JuristInnen sie einsetzen können.

00:37:53: Dann könnten sie auch automatisierte Textzusammenfassungen oder die Extraktion

00:37:57: von wichtigen Informationen einsetzen.

00:37:59: Diese Vereinfachung der Nutzung war auch das, was Virage dazu motiviert hat,

00:38:02: sich selbst mit der Entwicklung von Open Source zu beschäftigen.

00:38:05: In meiner Sicht muss legale Informationen für alle zugänglich sein,

00:38:10: unabhängig vom Level ihrer technischen Wissenschaft, ihrer legalen Wissenschaft

00:38:14: oder der Menge Geld, das sie haben. Das nennt sich demokratisierte legale Information.

00:38:20: Und das ist eine Grundlage, für die ich denke, Software Development can assist in achieving.

00:38:26: Specifically, the MyRights Project was built in a way that people from around the world,

00:38:31: across different jurisdictions, can simply just copy over the code base,

00:38:34: insert their own specific data from the relevant court, und die gesamte Webseite

00:38:40: wird in dieser spezifischen Beziehung nutzbar werden.

00:38:45: Und wenn wir in die Zukunft blicken, denke ich, dass Open-Source-Datenbankentwicklung

00:38:48: wirklich den Weg verändern kann, wie die komplexen legalen Informationen zu

00:38:52: denjenigen geliefert werden, die es am meisten brauchen.

00:38:54: Die Software, die Viraj mitentwickelt hat, sei also übertragbar,

00:38:57: sodass sie auch für andere Datenbanken eingesetzt werden könne.

00:39:00: So könnten in Zukunft Menschen die komplexen Inhalte von juristischen Texten

00:39:03: denjenigen zur Verfügung stellen, die sie am meisten benötigen.

00:39:06: Zum Schluss wollten wir von ihm auch noch wissen, welche Fähigkeiten aus seiner

00:39:09: Arbeit als Anwalt besonders hilfreich bei der Entwicklung von MyRights waren.

00:39:14: MyRights war gebaut, um den Leben der Bewerber einfacher zu machen.

00:39:17: Und als Bewerber weiß ich, welche Teile des legalen Forschungsprozesses Zeit braucht.

00:39:22: Zum Beispiel, wenn ein Klient in dein Büro kommt und ihre legalen Probleme darstellt,

00:39:26: dann muss man zuerst einen Fall finden, der ähnlich ist wie ihre legalen Probleme.

00:39:31: Die TechSearch-Funktion von MyRights macht das viel einfacher.

00:39:34: Nachdem ein User in seine TechSearch-Funktion einsteigt, wird er mit Fakten,

00:39:37: der Begründung und den Search-Highlights jedes einzelnen Falles vorgesehen.

00:39:41: Das ist wahrscheinlich der wichtigste Aspekt eines Fälls, wenn es um Initial Research geht.

00:39:45: Jetzt muss ein Nutzer nicht jedes Fälls untersuchen, um herauszufinden,

00:39:51: ob das Fälls relevant ist oder nicht. Das wird den Beratern viel Zeit versparen,

00:39:56: und ich nutze das persönlich in meinen Forschungen.

00:39:59: Ein anderes Problem, das ich gefunden habe, das ich nur als Berater gefunden

00:40:04: habe, war das Identifizieren der

00:40:06: Datenverleihungen in der Europäischen Gerichtshof Human Rights Database.

00:40:10: So konnte ich dafür sorgen, dass diese Daten-Labelung-Issue nicht in meine Rechte

00:40:14: fließen und die echten Daten korrigiert wurden, bevor sie in die Datenbüchse

00:40:19: eingeführt wurden. Ich glaube nicht, dass ich diese Art von Nuance finden könnte,

00:40:21: wenn ich kein Lawyer wäre.

00:40:22: Sein Wissen als Anwalt und seine Kenntnisse von juristischen Texten wären unersetzlich

00:40:26: für die Arbeit an MyRights, sagt Viraj.

00:40:28: Erstens kenne er sehr gut die Bedürfnisse von AnwältInnen bei der Suche in Datenbanken

00:40:32: und außerdem sei er in der Lage gewesen, auch die schwierigen Beschreibungen

00:40:36: aus der Datenbank des Europäischen Gerichtshofs für Menschenrechte zu entschlüsseln und in die aufzunehmen.

00:40:40: Vielen Dank an Virage für die Antworten auf unsere Fragen.

00:40:43: Und wie immer fragen wir uns auch nach dieser Folge, was haben wir mitgenommen?

00:40:46: Wie sieht es bei dir aus, Feli?

00:40:48: Ich habe gelernt, dass eigentlich jeder Quereinstieg eine Bereicherung für die

00:40:51: Open-Source-Hindernisse ist. Wenn alle ihre eigenen Expertise reinbringen,

00:40:54: wie zum Beispiel Virage oder Laura, dann können die Produkte einfach besser

00:40:56: werden, weil sie die Bedürfnisse dieser Gruppen besser kennen,

00:40:59: als zum Beispiel ein Developer.

00:41:01: Die Vielfalt steigert sich dann dementsprechend auch einfach und einfach her.

00:41:04: Und klar ist es auch ein bisschen scary, wenn man irgendwie keinen Background

00:41:07: hat mit Coden, aber es gibt auch immer eine Community, die ziemlich hilfsbereit

00:41:12: ist, wie wir schon gelernt haben.

00:41:13: Ich glaube, ich habe wahrgenommen, dass Open Source Entwicklung und Wissenschaft

00:41:16: einfach super gut zusammenpassen.

00:41:18: In beiden geht es eben darum, freies Wissen zu teilen und zu kollaborieren und zusammenzuarbeiten.

00:41:23: Und da ist Open Source Software einfach das perfekte Werkzeug für.

00:41:27: Ich selber wünsche mir, ich hätte das irgendwie schon früher gewusst,

00:41:30: dass das Open Source Software, dass man das auch als Wissenschaftler einfach

00:41:33: schreiben kann, denn ich habe selbst ein bisschen gecodet und habe das einfach

00:41:37: nie irgendwo sinnvoll veröffentlicht, weil es einfach nicht präsent war.

00:41:41: Also da ist auf jeden Fall irgendwie noch was zu tun, auch in der Awareness

00:41:44: bei den WissenschaftlerInnen.

00:41:47: Und ich glaube, der Punkt, der bei Virage mir am meisten hängen geblieben ist,

00:41:50: ist das, was du auch schon angesprochen hast.

00:41:52: Also Leute, die sich mit Problemen auskennen, sind auch die Leute,

00:41:56: die bei der Softwareentwicklung für diese Probleme involviert werden müssen,

00:41:59: damit man diese Probleme vernünftig lösen kann.

00:42:02: Das hätte jetzt niemand von außen machen können. Es hätte niemand ohne Biologiekenntnisse

00:42:06: GGET schreiben können und auch MyRights wäre ohne Kenntnisse im Recht einfach

00:42:10: nicht möglich gewesen, diese Software zu entwickeln.

00:42:14: Noch einmal vielen Dank an Laura und Viraj für eure Antworten auf unsere Fragen.

00:42:21: Und euch vielen Dank fürs Zuhören. Wie immer, wenn ihr mehr über uns erfahren

00:42:25: wollt, findet ihr alle Infos über uns auf protypefun.de.

00:42:28: Und wenn ihr keine Neuigkeiten verpassen wollt, dann abonniert unsere Newsletter

00:42:31: oder folgt uns auf Mastodon und Twitter.

00:42:34: Die Links dazu und auch zu allen anderen Dingen, die wir angesprochen haben,

00:42:37: findet ihr unten in den Show Notes.

00:42:39: Außerdem, wenn euch der Podcast gefallen hat, dann freuen wir uns über eine Bewertung.

00:42:43: Vielen Dank und tschüß!

Über diesen Podcast

Was ist Technologie im öffentlichen Interesse - oder Public Interest Tech? Das ist nicht nur die App, die die Terminsuche beim Bürgeramt erleichtert sondern viel mehr: Das sind Innovationsprozesse, die die Bedürfnisse der Nutzer*innen in den Mittelpunkt stellen und freie, nachhaltig zugängliche und adaptierbare Werkzeuge und Infrastruktur schaffen. Warum das wichtig ist? Damit Technologie allen individuell und der Gesellschaft als Ganzem nützt. Wer mehr darüber wissen will, hört am besten diesen Podcast, in dem wir in jeder Folge einen anderen Schwerpunkt von Public Interest Tech beleuchten, uns mit Expert*innen dazu austauschen und konkrete Projekte vorstellen. "Wir" sind übrigens das Team des Prototype Fund - und wir fördern Public Interest Tech.

von und mit Prototype Fund

Abonnieren

Follow us