00:00:11: Hallo und herzlich willkommen zum Public Interest Podcast. Ich bin Feli.
00:00:14: Hallo und ich bin Joram.
00:00:16: Gemeinsam arbeiten wir im Prototype Fund.
00:00:17: Hier im Prototype Fund fördern wir Einzelpersonen und kleine Teams und unterstützen
00:00:21: sie dabei, ihre Open-Source-Software-Ideen in Prototypen umzusetzen.
00:00:25: In dieser Staffel mit dem Thema Up and Coming sprechen wir mit diesen Menschen
00:00:28: darüber, wie sie zur Open-Source-Software-Entwicklung gekommen sind.
00:00:31: In dieser Folge geht es um den Quereinstieg. Also Menschen, die eigentlich was
00:00:35: anderes als Softwareentwicklung gelernt haben, jetzt aber genau dort gelandet
00:00:39: sind. Wir sind übrigens auch Quereinsteiger.
00:00:42: Ich zum Beispiel habe ja eigentlich mal Biologie gelernt und bin dann über so
00:00:46: ein paar Umwege zum Thema Open Source gekommen und das war auch nicht mal alles
00:00:50: leicht und ich habe auch nicht mal alles gleich verstanden,
00:00:52: aber es war immer interessant und ich glaube so ein bisschen hat es auch geholfen,
00:00:56: dass ich mit einer anderen Perspektive darauf blicken konnte.
00:00:59: Und ich studiere eigentlich Kulturwissenschaften und bin da nicht so oft mit
00:01:02: Open Source in Kontakt gekommen, mit Big Blue Button schon, das war's.
00:01:06: Ich durfte schon super viel Lärm im Projekt empfangen, also durch den Kick-Off,
00:01:09: durch die Demo-Days, aber Coden kann ich halt einfach immer noch nicht.
00:01:13: Ich finde es so spannend und frage mich halt, wenn ich Coden könnte,
00:01:15: was ich da für ein Projekt umsetzen würde.
00:01:18: Und weil uns das so interessiert, haben wir uns sehr darüber gefreut,
00:01:21: über das Thema Quereinstieg zu sprechen und da haben wir uns mit Laura Lübbert verabredet.
00:01:25: Sie ist Biologin und ist im Laufe ihrer Studien von Single-Cell Transcriptomics,
00:01:31: das ist natürlich für mich als Biologe spannend, aus dem Labor zu einem Rechner gewechselt.
00:01:35: Als Bioinformatikerin hat sie dann optimierte Analyse-Pipelines für diese sehr
00:01:39: komplexen Datensätze entwickelt und hat dann auch noch ein Tool geschrieben.
00:01:44: Das Tool heißt GGET und das konnte sie auch als wissenschaftliche Publikation
00:01:48: veröffentlichen und eben als Open-Source-Tool.
00:01:51: Wir haben sie remote getroffen und meine erste Frage an sie war,
00:01:55: welche Rolle spielt Open-Source-Software für dich in der Forschungsarbeit?
00:01:59: Ja, ich kann natürlich vor allem zu meinem Gebiet der Biologie sprechen und gerade in der Biologie,
00:02:08: generieren wir in den letzten Jahren immer mehr, immer größere Datensets.
00:02:13: Es wird immer kostengünstiger und immer effizienter, große Daten zu generieren. Und die ...
00:02:19: Es handelt sich um Hunderte von Gigabytes oder sogar Terabytes an Daten,
00:02:23: die kann man nicht mehr mal eben in Excel schmeißen. Da braucht man spezielle
00:02:28: Software in den meisten Fällen.
00:02:30: Oft, die von den Forschern selber geschrieben wird, um diese Daten zu analysieren.
00:02:36: Und darum ist es gerade jetzt so wichtig, dass mit dem Datenset auch die Software bereitgestellt wird,
00:02:44: weil es mehr als je die Software ein großer Teil von dem Endresultat ist,
00:02:52: weil man sich die rohen Daten so wie früher gar nicht mehr angucken kann.
00:02:55: Da ist ja auch so ein bisschen dein Tool, ein Werkzeug, was dabei hilft.
00:02:59: Darauf kommen wir dann gleich zu sprechen. Aber vorher würde mich interessieren,
00:03:02: Wir reden ja hier viele jetzt in dieser Folge über Quereinstieg in Open-Source-Software-Entwicklung.
00:03:07: Leute, die nicht klassische Entwickler oder EntwicklerInnen-Karrieren hinter
00:03:12: sich haben und dann bei Open-Source-Software gelandet sind.
00:03:14: Und deswegen würde mich interessieren, wie war das denn bei dir?
00:03:16: Du bist ja von der Laborbank,
00:03:18: von dem, was man so Wetlab nennt, vom quasi klassischen Experimentieren im Labor
00:03:22: hin zur Bioinformatik gewechselt und dann von der Bioinformatik,
00:03:26: ich weiß nicht, ob das ein großer Schritt dann noch war, hin zur Open-Source-Software-Entwicklung,
00:03:30: dass du jetzt Open-Source-Software-Entwicklerin bist. Wie war denn für dich dieser Weg?
00:03:34: Ja, also erstmal von der Laborbank zur Bioinformatik.
00:03:40: Ich hab ja mein Bachelor und Master an der Uni Leiden gemacht.
00:03:45: Und während meines Bachelors und Masters hab ich eigentlich überhaupt kein Programmieren
00:03:48: gelernt. Das war nicht wirklich Teil des Curriculums.
00:03:51: Und das war etwas, was ich unbedingt während meines PhDs nachholen wollte.
00:03:56: Und das war auch Teil, warum ich mir Caltech ausgesucht habe.
00:04:00: Es ist bekanntlich eine sehr technische Universität.
00:04:03: Und ich dachte, da kann man bestimmt gut Programmieren lernen.
00:04:06: War auch so. Also ich habe am Anfang meines PhDs an der Laborbank angefangen,
00:04:12: bin dann aber immer weiter in Richtung Bioinformatik gerutscht.
00:04:16: Und mir ist halt aufgefallen, dass da halt eine Nische ist, in der ich sehr
00:04:21: gut reinpasse mit meinen Fachkenntnissen in der Genetik.
00:04:25: Und dann eigentlich von der Bioinformatik zur Open Source, ja,
00:04:29: hast du schon gesagt, war eigentlich kein großer Schritt.
00:04:33: Also unser Hauptprodukt, mein Hauptprodukt jetzt ist mein Code,
00:04:37: meine Software und ich will natürlich,
00:04:39: dass die der Community und auch der Öffentlichkeit bereitgestellt wird.
00:04:44: Also für mich, meine Bioinformatik war immer Open Source und das sollte,
00:04:48: also ich finde auch, dass das sollte, sollte so sein, sollte gar nicht getrennt sein.
00:04:52: Da können wir gleich mal darauf zu sprechen kommen, was du denn entwickelt hast.
00:04:55: Du hast Gget, ist das richtig ausgesprochen?
00:04:57: Ja, das ist richtig.
00:04:58: Genau, Gget entwickelt. Das ist ein Tool. Was macht denn das eigentlich genau?
00:05:03: Ja, also GGET ist ein Programm, das gezielt Daten aus großen genomischen Datenbanken holt.
00:05:12: Und was bedeutet das oder warum brauchen wir das?
00:05:16: Also in meiner Forschung arbeite ich viel mit DNA und RNA-Sequenzen.
00:05:22: Und ich muss also meine neuen Sequenzen, um die zu identifizieren,
00:05:26: mit bekannten Sequenzen vergleichen.
00:05:31: Und diese Sequenzen, zum Beispiel für den Menschen, werden auf großen,
00:05:34: genomischen Datenbanken zur Öffentlichkeit bereitgestellt.
00:05:41: Also, diese Datenbanken sind öffentlich, das ist schon mal sehr gut.
00:05:44: Aber es handelt sich natürlich um sehr viele Informationen.
00:05:48: Ich brauch die Sequenz, ich brauch die genetische Information.
00:05:51: Ich brauch Informationen zur Transkription, zur Translation,
00:05:56: bis hin zum Protein, bestimmte Sequenzen.
00:05:59: Stehen für mehrere Proteine, also es handelt sich wirklich um sehr,
00:06:04: sehr vielfältige Informationen, die man sich von vielen verschiedenen Seiten
00:06:09: angucken kann und diese Informationen sind auf verschiedene Datenbanken verteilt und jede Datenbank,
00:06:16: jede Organisation, jede Firma hat halt irgendwo ihr Spezialgebiet und es gibt
00:06:23: ein bisschen Überlappung zwischen den Datenbanken, aber halt auch viel neue
00:06:27: Informationen, je nachdem, welche Datenbank du dir jetzt genau anguckst.
00:06:31: Und G-GET! fasziniert halt. Du kannst zum Beispiel G-GET!
00:06:38: Ein Gen geben und GIGETT zieht dann alle Informationen zu diesem Gen aus allen
00:06:43: Datenbanken gleichzeitig.
00:06:46: Und dann kannst du die Informationen vergleichen. Das ist auch immer wichtig.
00:06:52: Bei manchen Genen sind die Datenbanken sich nicht so sicher.
00:06:55: Das sieht man oft, dass verschiedene Datenbanken was anderes sagen.
00:06:58: Das ist sehr wichtig, um dann zu wissen, mit welchen Kenntnissen gehst du dann
00:07:03: weiter, welche Kenntnisse nimmst du in dein Endergebnis mit rein.
00:07:07: Und das hilft dann auch, dass andere Leute das nachvollziehen können,
00:07:10: wo du deine Kenntnisse her hast.
00:07:13: Und ich glaube, das kann man so ein bisschen vergleichen mit Trivago.
00:07:17: Trivago ist ja eine Hotel-Metersuche und G-GED ist eine Gen-Metersuche,
00:07:21: dass man die Information zu dem Gen von allen Datenbanken gleichzeitig kriegt und vergleichen kann.
00:07:28: Ich bin selber auch Biologe und dementsprechend neugierig. Mich würde noch interessieren,
00:07:32: technisch, wie hast du das gelöst, dass diese Gene, die in Datenbanken unterschiedliche
00:07:37: Namen haben, dass du die miteinander verknüpft bekommst.
00:07:40: Das ist vielleicht was, was auch für andere EntwicklerInnen relevant sein kann.
00:07:43: Man hat öfter mal mit Datenbanken zu tun, wo die Informationen zum gleichen
00:07:47: Ding sind, aber jeder hat eine andere Referenz dafür.
00:07:51: Ja, absolut. Ich würde auch sagen, das war das Hauptproblem,
00:07:54: das ich lösen musste. Das war am schwersten.
00:07:58: Und ich hab jetzt erst mal ...
00:08:02: Ich hab sozusagen eine Datenbank, also eine ID als Ausgangspunkt ausgesucht.
00:08:10: Also so ziemlich die größte Datenbank der Standard.
00:08:15: Ich habe gesagt, okay, mit den IDs fangen wir an.
00:08:19: Und das ist schon mal wichtig, weil dann fängst du schon mal nur mit einer ID an.
00:08:24: Und dann die eine ID zu den ganzen verschiedenen Datenbanken zu verknüpfen.
00:08:29: Ja, es war je nach Datenbank einfach oder nicht so einfach.
00:08:35: Manche Datenbanken waren da sehr hilfreich. Die hatten schon bestehende APIs.
00:08:39: Also, da musste ich nur den API-Call richtig aufbauen.
00:08:43: Für andere Datenbanken war es nicht so einfach. Teilweise gab es dann Third-Party-Tools,
00:08:49: die dann irgendwie probiert haben, die IDs zu verknüpfen.
00:08:53: Also, manchmal hab ich auch diese Third-Party-Tools mit eingebaut.
00:08:56: Das ist natürlich schwer, die muss man dann auch noch mal kontrollieren,
00:08:59: gucken, dass das alles stimmt, dass auch wirklich alle Ergebnisse eingebaut
00:09:03: werden, dass die Tools weiterhin unterhalten werden.
00:09:05: Da sprechen wir auch, das ist natürlich auch Teil des Open-Source-Problems.
00:09:11: Und ja, es war ein großes Problem und es gibt leider nicht ...
00:09:14: Eine Lösung, also es war sehr viel Puzzeln mit den Bausteinen,
00:09:20: die ich hatte, um dann ein Endergebnis zu kriegen, was irgendwie die Informationen
00:09:25: von allen Datenbanken holt.
00:09:26: Und dann hast du deine Ergebnisse veröffentlicht in einem wissenschaftlichen Journal,
00:09:30: das ist für WissenschaftlerInnen immer so der wichtigste oder ein sehr wichtiger
00:09:36: Punkt, weil das Karrieren ermöglicht, weil man dann Zitationen bekommen kann.
00:09:43: Aber was war denn für dich schwieriger, die Publikation in das Journal zu bekommen
00:09:47: oder den Code vorzubereiten für eine Open-Source-Veröffentlichung,
00:09:50: sodass andere Menschen das lesen können und damit weiterarbeiten können?
00:09:54: Ja, also G-GET war immer auf GitHub gehostet, also es war eigentlich immer Open-Source.
00:10:00: Ich hab direkt von Anfang an, war es öffentlich, von Anfang an hätten andere
00:10:05: Leute das benutzen können.
00:10:07: Was für die Open-Source-Veröffentlichung sehr viel Zeit und Arbeit gekostet
00:10:11: hat, war vor allem die Dokumentation und die Tutorials.
00:10:15: Das war mir sehr, sehr wichtig, auch im Namen von Accessibility.
00:10:21: Also, dass auch Anfänger G-GAP benutzen können, dass es ganz klar ist,
00:10:25: wie man das installiert, wie man das benutzt.
00:10:29: Für jede Art der Benutzung, die ich mir ausdenken konnte, habe ich ein Tutorial gebaut.
00:10:35: Also das hat natürlich sehr viel Arbeit und Zeit gekostet, war mir aber sehr,
00:10:39: sehr wichtig und ist auch etwas, was ich gerne mehr sehen wollte in der Open-Source-Community.
00:10:44: Die Publikation, also Jiget wurde ja im Journal Bioinformatics als Application Note publiziert.
00:10:53: Und so eine Application Note ist eigentlich ein sehr kurzes Paper, es ist nur zwei Seiten.
00:10:59: Und in den zwei Seiten steht drin, was ist das Programm, wofür,
00:11:03: denke ich, das Leute es benutzen können. Und es geht bei der Publikation vor
00:11:07: allem darum, die Community wissen zu lassen, dass das Programm jetzt besteht.
00:11:12: Und dass du halt Peer Reviewers, also Gutachter, andere Forscher hast,
00:11:17: die sich das Programm angucken und sagen, ja, wir finden das okay so,
00:11:21: das kann jetzt so von der Community akzeptiert werden.
00:11:25: Also, das Paper selber zu schreiben, war jetzt nicht so schwer,
00:11:27: Das ist ja nur eine Beschreibung von dem Programm, was ich monatelang geschrieben
00:11:32: habe und das ich natürlich sehr, sehr gut kannte.
00:11:36: Allerdings, so wie der Peer-Review-Prozess im Moment funktioniert, Also...
00:11:44: Es wird erwartet, dass Forscher ohne Bezahlung in ihrer Freizeit für das Journal
00:11:50: irgendwelche Papers lesen und Feedback geben, was natürlich sehr, sehr viel Arbeit ist.
00:11:55: Und was bei meinem Paper passiert ist, ist, dass das Journal ein halbes Jahr
00:11:59: lang keine Reviewer gefunden hat.
00:12:02: Und das passiert gerade jetzt und auch während der Pandemie sehr, sehr viel.
00:12:07: Und das kann man dem Forschern ja auch gar nicht übel nehmen,
00:12:10: schon eigentlich Ausbeutung der Journals und ich glaube, wir könnten einen ganzen
00:12:13: Podcast füllen über die Probleme mit dem jetzigen Peer-Review-System.
00:12:19: Aber das war so eigentlich das größte Problem während der Publikation,
00:12:24: dass es so lange gedauert hat, bis das Journal Gutachter gefunden hat.
00:12:32: Aber als die Reviews einmal da waren, sie waren sehr positiv und dann ging es
00:12:36: auch alles sehr schnell.
00:12:37: Glaubst du, dass das Problem mit den GutachterInnen ein spezifisches Problem
00:12:41: war, weil es um diese Open-Source-Software geht, die diesen speziellen Fokus
00:12:47: hat, oder ist es ein allgemeines Problem, was man woanders auch hat?
00:12:52: Weil mir ist es noch nicht so super häufig untergekommen, dass quasi die GutachterInnen
00:12:56: knapp sind, aber ich habe auch nicht im Bereich Bioinformatik Erfahrungen gesammelt.
00:13:00: Deswegen würde mich interessieren, ob das was ist, was häufiger vorkommt.
00:13:05: Ich glaube schon, dass es etwas ist, was häufiger vorkommt.
00:13:10: Also nicht nur in der Biologie, sondern in allen Bereichen der Forschung.
00:13:14: Also ja, gerade in der Pandemie habe ich sehr viel gehört von anderen ForscherInnen,
00:13:23: dass deren Papers einfach nicht reviewed wurden, weil keine GutachterInnen gefunden wurden.
00:13:29: Wie ist es denn mit dem Support von deiner Software? Ich hab so ein bisschen
00:13:33: recherchiert im Vorfeld, was Open-Source-Software bedeutet in der Wissenschaft
00:13:37: oder in der akademischen Welt.
00:13:40: Und das, was sehr häufig genannt wurde, ist, dass ForscherInnen sich davor fürchten,
00:13:45: so viel Supportanfragen zusätzlich noch zu tun zu haben.
00:13:49: Denn neben ihrem Forschungsalltag und dem sozusagen, was du grade gesagt hast,
00:13:53: der freien Arbeit, die sie eh noch machen müssen für die Journals,
00:13:56: was quasi Teil des Wissenschaftssystems ist, dann auch noch Software-Support
00:14:00: zu machen, zu entschlossen hat, seine Software zu teilen, schreckt viele Menschen
00:14:05: ab. Was ist da deine Erfahrung?
00:14:07: Ja, ich glaube, es gibt...
00:14:09: Hier zwei Seiten zu dem Problem. Wenn man seine Software veröffentlicht,
00:14:14: dann stellt man die natürlich auch ...
00:14:16: Offen für alle, die zu lesen. Und man stellt die auch ...
00:14:20: Ja, man stellt die für Future Requests, also neue Entwicklungen offen, aber auch zur Kritik.
00:14:28: Und ich glaube, das kann schon sehr unheimlich sein. Und ich finde auch,
00:14:33: dass es unsere Community ... dass die Aufgabe von unserer Community dafür zu
00:14:37: sorgen, dass die Kritik immer konstruktiv ist und dass immer respektvoll miteinander umgegangen wird.
00:14:43: Sowohl in der Kritik als auch in Future Requests.
00:14:46: Und dass da halt auch das Bewusstsein da ist, dass das nicht der Vollzeitjob
00:14:51: ist, von der Entwicklerin dieses Programm zu unterhalten.
00:14:56: Und dass da Wertschätzung und Dankbarkeit im Spiel ist.
00:15:02: Zu den Future Requests, ich bin ein bisschen überrascht zu hören,
00:15:05: dass Leute das als negativ empfinden, eigentlich ein großer Pluspunkt von Open Source,
00:15:10: dass man eine Community aufbaut, dass man zum Beispiel durch GitHub-Issues ein
00:15:16: System hat, wo Leute um neue Features fragen können oder selber einbauen kann.
00:15:24: Und ich finde auch gar nicht, dass die Aufgabe der Entwicklerin ist,
00:15:30: die Features dann reinzubauen,
00:15:32: sondern halt die Open-Source-Community dann reinspringen kann und dass es sehr
00:15:38: schön ist, dass eigentlich alle mit ihren speziellen Fachkenntnissen dann zu
00:15:42: den Programmen beitragen können.
00:15:44: Also du siehst das eher als eine Bereicherung an, dass so Leute sagen,
00:15:48: hey, schau mal, hier kann man noch was verbessern als Stressfaktor.
00:15:53: Ja, auf jeden Fall. Also solange halt das Bewusstsein da ist,
00:15:58: dass es dann nicht die Aufgabe ist der Entwicklerin, das wirklich so zu machen
00:16:03: und dass halt da mit Respekt und Dankbarkeit mit umgegangen wird, auf jeden Fall.
00:16:08: Und wie viel Unterstützung hast du erhalten aus deiner Forschungsgruppe für
00:16:12: die Softwareentwicklung und auch dann eben bei dem Streben, das Ganze zu dokumentieren
00:16:17: und frei verfügbar zu machen?
00:16:18: Ja, also GGET hat angefangen als etwas, was ich für mich selber geschrieben
00:16:25: habe, aus Frustration eigentlich.
00:16:29: War total genervt, immer wieder durch verschiedene Browser durchzuklicken und zu versuchen,
00:16:35: in der Navigation von den Datenbanken jetzt meine Informationen zu finden.
00:16:45: Dazu muss ich ja was sagen.
00:16:48: Ich hab dann irgendwann in einer Präsentation Jiget erwähnt vor meiner Gruppe.
00:16:53: Und das kam halt irgendwie einfach so auf. Und dann meinte mein Professor meine
00:16:58: Gruppe halt, ach, wart mal, erzähl uns
00:16:59: mal mehr darüber. Und so hab ich herausgefunden, dass der Bedarf da ist.
00:17:05: Also, es war mir vorher noch überhaupt nicht wirklich bewusst,
00:17:08: dass das so nützlich sein könnte für so viele andere Leute, die dasselbe Problem haben.
00:17:14: Und dann hat halt vor allem mein Professor, Lia Pachter, mir geholfen,
00:17:18: das Programm in die endgültige Version, die wir heute kennen,
00:17:22: zu bringen und hat mir auch geholfen, das Paper zu schreiben.
00:17:28: Und ich habe das Glück, mit sehr, sehr brillanten, sehr, sehr hilfsbereiten
00:17:32: Leuten zu arbeiten in meiner Gruppe.
00:17:36: Also selbst wenn die jetzt nicht direkt involviert waren in G-GET,
00:17:41: glaube ich schon, dass eine positive Arbeitsumgebung Und in der man sich unterstützt
00:17:47: und gefördert fühlt, dass es sehr, sehr wichtig ist für die Produktivität.
00:17:51: Und in dem Sinne haben sie mir sehr geholfen.
00:17:53: Ja, gibt es auf der anderen Seite irgendwelche Herausforderungen in der Open
00:17:57: Source Software Entwicklung, die spezifisch sind fürs akademische Umfeld?
00:18:01: Hast du genügend Zeit dafür gehabt oder siehst du das andere?
00:18:05: Vielleicht, ich meine, es klingt ja so, es ist in deiner Forschungsgruppe insgesamt
00:18:09: schon eine sehr angenehme Atmosphäre.
00:18:10: Aber siehst du, dass es vielleicht in anderen Forschungsgruppen an Ressourcen mangelt,
00:18:14: an Zeit mangelt oder auch an Wertschätzung dafür,
00:18:17: sich überhaupt neben dem quasi dem Ziel, ich möchte jetzt hier eine biologische
00:18:21: Frage beantworten und ein Paper rauskriegen, sich dabei auch noch darum zu kümmern,
00:18:26: dass das Werkzeug, was man dabei benutzt, vielleicht sinnvoll dokumentiert und veröffentlicht ist?
00:18:31: Ja, auf jeden Fall. Also, ich glaube, die Wertschätzung fehlt da und auch das Bewusstsein,
00:18:38: wie viel Zeit das wirklich kostet und wie schwer das ist, ein Programm in eine
00:18:44: Form zu kriegen, dass andere Leute das nachvollziehen und benutzen können.
00:18:48: Also ich glaube, ja, das Bewusstsein fehlt da und damit halt auch die Wertschätzung dafür.
00:18:53: Und dann würde ich mich gerne noch mal beim Prototype bedanken,
00:18:56: weil ich glaube Initiativen wie Prototype sind ein sehr, sehr guter Anfang,
00:19:00: um diese Wertschätzung und Vergütung aufzubringen.
00:19:05: Ich finde es auf jeden Fall sehr wichtig, dass wir hoffentlich in der Zukunft
00:19:09: zu dem Punkt kommen, Boah.
00:19:13: Die Veröffentlichung des Programms in einer Form, dass es mindestens für andere
00:19:17: lesbar ist, ein ganz normaler Teil der Paper-Publikation ist.
00:19:23: Also, dass es ohne überhaupt nicht geht.
00:19:27: Und ... ähm ... dann ... ja, genauso wie man jetzt ... Man publiziert ja sein
00:19:32: Paper nicht ohne Message-Section.
00:19:36: Also, niemand würde sagen, ach, warum vergräulichst du dir denn deine Zeit,
00:19:40: seine Message-Section zu schreiben? so sollte es ein ganz normaler Teil der
00:19:44: Forschung und der Publikation sein, seinen Code bereitzustellen.
00:19:47: Dann ein anderer Punkt, den ich auch in meiner Recherche so immer wieder gefunden
00:19:51: habe, ist das Problem der Reproduzierbarkeit.
00:19:54: Und das hast du ja auch schon so ein bisschen angesprochen, aber ich würde gerne
00:19:56: ein bisschen mehr darüber erfahren.
00:19:58: Reproduzierbarkeit für alle, die sich da nicht so im Thema auskennen,
00:20:02: ist das Problem, dass immer wieder Dinge veröffentlicht werden von einer Arbeitsgruppe
00:20:07: und dann versucht eine andere Arbeitsgruppe mit den gleichen Methoden das gleiche
00:20:10: Experiment nachzumachen und kann nicht das gleiche Ergebnis beobachten.
00:20:14: Und das ist natürlich dann ein Problem, wenn man veröffentlichte Daten als sozusagen
00:20:19: die Wahrheit, was auch immer das genau sein soll, sieht, weil man denen eben
00:20:23: weniger vertrauen kann.
00:20:24: Und da gibt es immer mehr Arbeitsgruppen oder immer mehr Diskurs,
00:20:28: sag ich eher, immer mehr Diskurs innerhalb der Forschung. Wie gehen wir damit
00:20:31: um mit dieser Reproduzierbarkeitskrise?
00:20:33: Und aus deiner Sicht können da Open-Source-Software und vielleicht auch so offene
00:20:37: Datenbanken, offene Datensets da ein Weg sein, aus dieser Reproduzierbarkeitskrise rauszukommen?
00:20:45: Ja, auf jeden Fall. Also, ich glaube, ohne offene Datenbanken und Open-Source-Code geht's gar nicht.
00:20:53: Also, ich glaube, das ist überhaupt erst
00:20:55: der erste Schritt, um aus dieser Reproduzierbarkeitskrise rauszukommen.
00:20:58: Also, unbedingt. Ohne Open-Source-Code und Daten wissen wir ja erstmal überhaupt
00:21:07: nicht, was denn reproduzierbar ist.
00:21:10: Wenn ich testen möchte, ob ein Resultat reproduzierbar ist, brauche ich den
00:21:14: Code und die Daten, sonst kann ich mein Resultat überhaupt nicht vergleichen
00:21:20: mit denen, die im Paper beschrieben würden.
00:21:24: Also ich würde sagen, ohne geht es gar nicht.
00:21:28: Ja, das ist für mich ein absoluter No-Brainer.
00:21:32: Ohne Open Source, Open Data kommen wir nicht aus der reproduzierbaren KS-Krise raus.
00:21:38: Und wie siehst du da den aktuellen Zustand? Findet das schon statt oder wird
00:21:42: das mehr, wird das besser?
00:21:43: Ja, also ich glaube, es gibt zum Glück immer mehr Bewusstsein.
00:21:48: Erstmal um die Reproduzierbarkeitskrise herum. Das Bewusstsein ist auf jeden Fall schon da.
00:21:54: Es gibt immer mehr Push, Daten und Code zu veröffentlichen.
00:21:58: Also viele Journals erlauben dir nicht mehr, dein Paper zu publizieren,
00:22:05: ohne dass du deinen Code veröffentlichst.
00:22:07: Das ist aber oft nicht genug, also oft wird überhaupt nicht geguckt,
00:22:13: in welchem Stand ist denn der Code, ist wirklich all der Code da?
00:22:18: Läuft der Code? Also da wird in der Peer Review im Moment eigentlich überhaupt nicht nachgeguckt.
00:22:23: Und das kommt dann erst später raus, wenn der Stand des Codes eigentlich überhaupt
00:22:31: nicht so ist, wie man das erwartet hätte.
00:22:36: Ein sehr gutes Beispiel von der Pandemie war das Programm CovidSim von Neil Ferguson.
00:22:42: Das war ein Programm, um halt die Epidemie zu modellieren.
00:22:47: Und das Programm wurde vor allem von England, von der Regierung benutzt.
00:22:52: Also die Ergebnisse wurden von der Regierung in England benutzt,
00:22:55: um die Covid-Response zu designen.
00:23:01: Also das Programm war wirklich sehr, sehr wichtig in deren Covid-Response-Information.
00:23:09: Und dann kam am Ende raus, dass das Programm überhaupt nicht läuft.
00:23:14: Es wurde eines von den buggiest programs ever beschrieben. Also es war ein Riesenproblem
00:23:20: und ja, der Code war immer da.
00:23:22: Also es war jetzt gar nicht so, dass der nicht veröffentlicht wurde.
00:23:25: Aber ja, die Regierung haben ihre Ergebnisse so angenommen, Bevor jemand geguckt
00:23:31: hat, läuft das dann überhaupt? Können wir das reproduzieren?
00:23:36: Und ja, also ich glaube, das Bewusstsein wird immer größer, aber...
00:23:42: Ja, wir sind auf dem richtigen Weg, wir sind noch nicht ganz da.
00:23:45: Gibt es was, was sich ändern müsste, damit Open Source Software Entwicklung
00:23:49: in der Wissenschaft einfacher wird, damit mehr Menschen ihren Code auch sauber veröffentlichen?
00:23:56: Ja, auf jeden Fall. Also ich glaube, ja, die Wertschätzung und Vergütung,
00:24:01: Prototype Fund nochmal, danke schön, die fehlt auf jeden Fall,
00:24:05: das können wir viel besser machen. Dazu kommt Ausbildung.
00:24:10: Also, ich find's eigentlich nicht akzeptabel, dass man heutzutage noch seinen
00:24:15: Bachelor oder Master in der Biologie machen kann, ohne jegliches Programmieren zu lernen.
00:24:21: Also, mit den Daten, mit denen wir heutzutage umgehen müssen,
00:24:25: das geht eigentlich nicht mehr.
00:24:29: Und dazu kommt, find ich, dass ... unsere Aufgabe als Community ist,
00:24:34: dann eine Umgebung zu schaffen, in der man lernen kann, in der man Anfänger
00:24:40: sein kann, in der man Fehler machen kann.
00:24:43: Dass halt die Motivation da ist, seinen Code zu veröffentlichen,
00:24:47: dass das Feedback willkommen ist, dass man da keine Angst haben muss,
00:24:51: da irgendwie respektlose Kommentare
00:24:55: zu kriegen, weil man halt nicht die Software-Engineerung-Ausbildung hat,
00:25:01: Aber dass da halt die Community für einen da ist, um zu helfen.
00:25:06: Das verbindet sich auch so ein bisschen mit dem nächsten Punkt, der mich interessiert.
00:25:11: Denn diese Wertschätzung innerhalb der Community ist ja auch innerhalb der Wissenschafts-Community
00:25:16: mitunter ein Problem. Also die Karrieren oder also eine Karriere im akademischen
00:25:21: Bereich ist sehr von Konkurrenz und Stress geprägt.
00:25:25: Wie würdest du das denn sehen? Ist es ein Vorteil oder Nachteil für die Karriere,
00:25:29: wenn man sich, also wenn man für die reine Forschungskarriere,
00:25:32: wenn man sich um die quelloffene Verteilung oder auch den Support von seiner
00:25:36: eigenen Software kümmert? Ja, also...
00:25:42: Im Moment ist die Wertschätzung, glaube ich, noch nicht da.
00:25:46: Also, ich glaube, es gibt sehr, sehr hohen Druck, um so schnell wie möglich
00:25:49: seine Ergebnisse zu produzieren.
00:25:52: Und da fällt das Saubermachen des Codes schon mal unter, auch, ja, mach ich später.
00:25:59: Oder sehr beliebt ist auch Code made available upon reasonable request.
00:26:05: Also, dass die Autoren dann sagen, kannst mich gerne nach dem Code fragen.
00:26:11: Ob der dann wirklich geschickt wird oder nicht, ist halt immer so eine Frage.
00:26:14: Und auch, gut, es ist halt dann immer noch kein Open-Source-Code.
00:26:19: Also, ja, ich glaube, das müssen wir in der Akademie auf jeden Fall besser machen.
00:26:24: Ich glaube, die Vorteile sind aber schon da.
00:26:28: Wenn dein Programm notsbar ist, dann kriegst du dafür auch Citations,
00:26:33: also Zitate, dass andere Leute sagen, ich habe dieses Programm benutzt.
00:26:37: Ich musste meine Analyse nicht noch mal von neu anfangen, weil ich auf die Ergebnisse
00:26:43: von dieser anderen Gruppe aufbauen konnte.
00:26:46: Und das ist natürlich für einen Forscher oder eine Forscherin das Beste,
00:26:52: was dir passieren kann. Dass andere Leute sagen, deine Forschung war nützlich.
00:26:56: Und ich hab darauf aufgebaut.
00:27:00: Und deine Glaubwürdigkeit als Forscher ist natürlich auch sehr wichtig.
00:27:03: Wenn deine Ergebnisse leicht reproduzierbar sind, hilft das,
00:27:07: leitt das Glaubwürdigkeit, was auch sehr, sehr wichtig ist.
00:27:12: Beide diese Sachen sind natürlich Langzeitziele.
00:27:17: Und also, die Belohnung ist nicht so direkt da, wie das Publizieren des Papers
00:27:24: wäre. Aber ich glaube, die Vorteile sind schon da. Und ich glaube ...
00:27:29: Ja, Leute ... Ja, Forscher und Forscherinnen, also grade auch in der Ausbildung
00:27:34: sollten wir mehr Nachdruck legen.
00:27:37: Dass die Vorteile schon da sind und dass es wirklich wichtig ist,
00:27:39: dass deine Forschung reproduzierbar ist und glaubwürdig und,
00:27:44: ja, dass es total schön ist, wenn andere Leute dein Programm benutzen.
00:27:50: Also jetzt mit G-GET sehe ich das ja auch, Leute benutzen das für Dinge,
00:27:53: die ich mir nie hätte ausdenken können, weil es ist überhaupt nicht mehr ein
00:27:57: Fachgebiet und das ist sehr, sehr cool zu sehen.
00:27:59: Wie geht es denn jetzt mit G-GET weiter? Du bist jetzt für sechs Monate gefördert
00:28:03: vom Prototype Fund, um das Programm weiterzuentwickeln und neue Funktionen hinzuzufügen.
00:28:08: Worauf freust du dich denn da am meisten in den nächsten sechs Monaten?
00:28:11: Beziehungsweise die sechs Monate haben ja schon angefangen. Also es sind jetzt
00:28:13: noch fünfeinhalb oder so fünf.
00:28:17: Ja, ja, erst mal nochmal vielen, vielen Dank für den Support.
00:28:22: Es freut mich sehr und ich freue mich am meisten auf die Community-Bildung.
00:28:27: Ich hatte es in der vorherigen Frage schon ein bisschen angesprochen.
00:28:33: Ja, wenn du ein Open-Source-Programm schreibst, dann öffnet das halt auch die
00:28:38: Tür für die Community, um darauf aufzubauen.
00:28:43: Und ich hab zum Beispiel jetzt letzte Woche einen Pull-Request auf GitHub gekriegt,
00:28:49: dass jemand eins von meinen G-GET-Modulen ausgebaut hat, dass man damit jetzt
00:28:54: nicht nur menschliche Gene finden kann, sondern auch Pflanzengene.
00:29:00: Und das ist natürlich total cool, ja.
00:29:03: Und da hätte ich selber überhaupt nicht dran gedacht. Da hab ich auch gar nicht
00:29:06: die Fachkenntnisse, um das so zu machen, dass es nützlich ist für andere Leute.
00:29:11: Aber dadurch, dass G-GET open source und gut dokumentiert ist,
00:29:15: konnte ein Wissenschaftler mit der Expektise ganz einfach das G-GET ausbauen,
00:29:24: dass das jetzt auch für Pflanzengene funktioniert.
00:29:30: Und diesem Community-Effort, Erweiterung von GIGETT durch die Community,
00:29:33: da würde ich sehr gerne mehr Fokus drauflegen.
00:29:37: Also ich habe jetzt letzte Woche detaillierte Contributing Guidelines geschrieben.
00:29:43: Also ich hoffe, dass das immer mehr funktioniert und ich glaube,
00:29:47: dass es eine der schönsten Sachen ist an Open Source Programmen,
00:29:52: wenn dann die Community wirklich anfängt, darauf aufzubauen.
00:29:56: Du hast ja jetzt konkret Zeit bekommen, dich um die Softwareentwicklung zu kümmern.
00:30:01: Wie reagiert da dein Umfeld drauf?
00:30:05: Ja, also meine direkte Forschungsgruppe findet das total super.
00:30:10: Wir sind natürlich alle große Fans von Open Source Software.
00:30:15: Das ist so ein bisschen, was wir machen.
00:30:18: Also das war gar keine Frage, dass es eine gute Idee ist, sich darum zu kümmern.
00:30:24: Und dass das auch sehr wichtig ist, dass das passiert.
00:30:30: Ich glaube auch, der Erfolg von G-GET spiegelt den Bedarf in der Community wieder.
00:30:36: Also das hat natürlich geholfen, dass das überhaupt keine Frage war,
00:30:39: ob der Bedarf da ist, ob es anderen Leuten wirklich hilft.
00:30:44: Also das hat mir in dem Fall sehr geholfen, dass ich habe sozusagen Daten,
00:30:49: um zu zeigen, nee, was ich mache, es ist schon wichtig,
00:30:53: das benutzen andere Leute, wäre vielleicht etwas schwieriger gewesen,
00:30:56: wenn es so ein bisschen unklar wäre, ob das, was ich jetzt mache wirklich nützlich
00:31:02: ist oder nicht, aber in dem Fall von G-GET.
00:31:06: War es ganz klar, die allgemeine Reaktion war positiv und meine Gruppe benutzt
00:31:14: G-GET auch sehr ausgiebig.
00:31:16: Also es ist auch für uns intern sehr wichtig, dass G-GET weiterhin gut läuft,
00:31:21: dass die Ergebnisse korrekt sind. Also es war gar keine Frage mehr.
00:31:25: Zum Schluss würde mich noch interessieren, was du anderen Menschen empfehlen würdest,
00:31:30: wenn die überlegen, in das Thema Open-Source-Software-Entwicklung einzusteigen,
00:31:34: die eben auch, weil sie vielleicht schon einen Bioinformatik-Hintergrund haben,
00:31:37: sich aber noch nicht so mit der Seite der Software-Veröffentlichung beschäftigt haben.
00:31:41: Gibt es da irgendetwas, was du selbst gerne gewusst hättest,
00:31:44: bevor du dich mit dem Thema auseinandergesetzt hast?
00:31:47: Ja, ich würde sagen, fang einfach an. Programmieren ist etwas,
00:31:52: was man sich relativ einfach selber beibringen kann.
00:31:56: Also es gibt sehr viele Online-Tools und Tutorials und Kurse,
00:32:01: die man sich gratis angucken kann.
00:32:05: Es fällt am Anfang immer sehr schwer. Also, es ist ganz normal,
00:32:09: wenn es total frustrierend ist am Anfang.
00:32:12: Das haben wir alle durchgemacht. Also, lass dich vor allem nicht unterkriegen.
00:32:18: Und ich würde vielleicht den Tipp geben, GitHub ist am Anfang vielleicht für
00:32:23: den Anfänger nicht ganz so klar, warum es so wichtig ist.
00:32:27: Aber ja, fang direkt an, all dein Code auf GitHub zu publizieren, zu unterhalten.
00:32:36: Dieses Version Control, dass man sehen kann, wann was passiert ist,
00:32:39: ist sehr, sehr wichtig in der Open-Source-Software-Entwicklung
00:32:42: oder in der Software-Entwicklung im Allgemeinen.
00:32:46: Und ich würde auch sagen, wenn du noch gar keine Idee hast, was du machen möchtest,
00:32:52: kann man sehr einfach in GitHub-Issues reingucken von bestehendem Programm, zum Beispiel GGET.
00:33:00: Ich hab jede Menge Future Requests, also Nachfragen von anderen Forscherinnen,
00:33:05: die gerne irgendwelche Weiterentwicklungen von GGET sehen würden.
00:33:10: Und ich hab da nicht immer Zeit für. Und da kommt halt dieser Community-Input,
00:33:14: ist da sehr, sehr willkommen.
00:33:17: Und wenn du als Anfänger dir so eine Issue raussuchst, dann weißt du schon genau,
00:33:21: das Programm besteht schon, das Programm hat eine Struktur, auf die du aufbauen
00:33:25: kannst und du weißt, dass was auch immer du machst, da ist ja Bedarf schon da,
00:33:30: weil jemand hat danach gefragt.
00:33:32: Und das ist eigentlich sehr cool, wenn du irgendwie anfangen möchtest,
00:33:36: weißt aber nicht so ganz, was du machen möchtest, guck dir die GitHub-Issues
00:33:40: an von deinem Lieblingsprogramm.
00:33:41: Es gibt bestimmt irgendwas und die Probleme variieren auch in Schwierigkeitsgrad.
00:33:48: Also da kann man sich ein bisschen aussuchen, was man machen möchte.
00:33:52: Und ich glaube, ich habe am Anfang auf jeden Fall nicht genug auf GitHub rumgeguckt.
00:33:59: Und ja, es ist ein bisschen ...
00:34:02: Ja, schwer zu navigieren am Anfang, aber es kommt dann doch schnell und ja,
00:34:06: lass dich vor allem nicht runterkriegen. Wir waren alle Anfänger.
00:34:10: Ach, und auch ganz wichtig, was ich oft höre, ist, warum soll ich dann überhaupt
00:34:17: lernen? Ich werde sowieso nie so gut sein wie der Software-Ingenieur mit 30 Jahren Erfahrung.
00:34:22: Das stimmt. Ich bin auch nicht so gut wie der Software-Ingenieur mit 30 Jahren Erfahrung.
00:34:27: Aber der Software-Ingenieur hat nicht deine Fachkenntnisse Und die Fachkenntnisse
00:34:32: oder Domain-Knowledge leiten dazu,
00:34:35: dass du etwas beitragen kannst, wo die Software-Engineers gar nicht dran gedacht haben.
00:34:43: Ja, da fehlte das Fachkenntnis. Und das, glaube ich, kann man mit G-Gate ganz klar sehen.
00:34:50: Es ist eigentlich so ziemlich mein erstes Programm, was ich je geschrieben habe.
00:34:55: Ich hab erst vor vier Jahren angefangen, zu programmieren zu lernen.
00:34:59: Und das hätte bestimmt ein Software-Ingenieur besser machen können.
00:35:05: Aber die Fachkenntnisse, die waren halt nicht da. Und ich wusste genau,
00:35:09: was Genetiker brauchen, wie sie mit dieser Software umgehen möchten.
00:35:14: Und das ist halt genauso wichtig wie das tatsächliche Programmieren am Ende.
00:35:21: Das war unser Gespräch mit Laura. Vielen Dank für das spannende Gespräch.
00:35:26: Es gibt auch Querenstücke aus anderen Bereichen. Viraja Kothoto ist der Gründer
00:35:30: und Direktor von Technology Solution for Human Rights.
00:35:32: Er ist ein internationaler und nationaler Menschenrechtsanwalt,
00:35:35: Flüchtlingsanwalt und Sozialunternehmer mit einem starken Hintergrund in humanitärer
00:35:39: Arbeit, Technologie und Recht.
00:35:41: Er hat selbst auch schon Open Source Software entwickelt. Er war nämlich Teil
00:35:44: der Förderung 012 und hat mit der Anwendung MyRights ein Werkzeug geschaffen,
00:35:48: mit dem Menschen Urteile zu Menschenrechten leichter durchsuchen und verstehen können.
00:35:52: Auch ihm haben wir ein paar Fragen gestellt und zuerst wollten wir von ihm wissen,
00:35:55: welche Rolle Open Source Software heute für JuristInnen spielt.
00:35:58: Miraj hat uns auf Englisch geantwortet und wir werden deswegen seine Antworten
00:36:01: danach noch einmal für alle auf Deutsch zusammenfassen.
00:36:04: In meiner Erfahrung habe ich nicht viele Fälle erlebt, in denen Open-Source-Software
00:36:09: in der legalen Welt oft benutzt wird.
00:36:10: Die meisten legalen Professionen verlassen ziemlich teure private Databasen,
00:36:15: die bis zu Tausende Tausend Dollar für ein jährliches Abkaufen kosten können.
00:36:20: Das bedeutet, dass NGOs, Nicht-Profit-Praktitioner oder Solo-Lehrer diese Databasen
00:36:24: nicht wirklich bezahlen können.
00:36:27: Aber in dem Sinne, dass es ziemlich gute freie Databasen gibt,
00:36:30: wie Worldly. Das ist eine fantastische Ressource und ich benutze sie oft.
00:36:34: Aber dieses Database ist nicht akzessibel, es ist nicht mit human-centered Design
00:36:39: Prinzipien designt und es ist nicht Open Source.
00:36:42: Laut Virage werde also Open Source Software nur selten von JuristInnen eingesetzt,
00:36:45: obwohl es einen eindeutigen Bedarf gäbe. Denn professionelle Software sei sehr teuer.
00:36:50: Es gäbe auch kostenlose Alternativen, so wie Worldly, die Virage selbst auch schon eingesetzt habe.
00:36:55: Laut Virage ist das Problem auch selten, dass Wissen oder Werkzeuge für freie
00:36:58: Software fehlen. In akademischen Papern gäbe es einen Haufen Fachwissen.
00:37:31: Wir wissen, dass sie extrem vertrauensvoll sind, um Texte zu summarisieren,
00:37:34: legale Ergebnisse zu prädiktieren und relevante legale Informationen zu erwerben.
00:37:39: All diese Methoden würden einem legale Text mehr erreichbar machen.
00:37:43: Viraj sagt, wie so oft scheitere es also an der Umsetzung. Die Technologie braucht
00:37:47: nur eine sinnvolle Oberfläche für die Benutzung, damit auch tatsächlich alle
00:37:51: JuristInnen sie einsetzen können.
00:37:53: Dann könnten sie auch automatisierte Textzusammenfassungen oder die Extraktion
00:37:57: von wichtigen Informationen einsetzen.
00:37:59: Diese Vereinfachung der Nutzung war auch das, was Virage dazu motiviert hat,
00:38:02: sich selbst mit der Entwicklung von Open Source zu beschäftigen.
00:38:05: In meiner Sicht muss legale Informationen für alle zugänglich sein,
00:38:10: unabhängig vom Level ihrer technischen Wissenschaft, ihrer legalen Wissenschaft
00:38:14: oder der Menge Geld, das sie haben. Das nennt sich demokratisierte legale Information.
00:38:20: Und das ist eine Grundlage, für die ich denke, Software Development can assist in achieving.
00:38:26: Specifically, the MyRights Project was built in a way that people from around the world,
00:38:31: across different jurisdictions, can simply just copy over the code base,
00:38:34: insert their own specific data from the relevant court, und die gesamte Webseite
00:38:40: wird in dieser spezifischen Beziehung nutzbar werden.
00:38:45: Und wenn wir in die Zukunft blicken, denke ich, dass Open-Source-Datenbankentwicklung
00:38:48: wirklich den Weg verändern kann, wie die komplexen legalen Informationen zu
00:38:52: denjenigen geliefert werden, die es am meisten brauchen.
00:38:54: Die Software, die Viraj mitentwickelt hat, sei also übertragbar,
00:38:57: sodass sie auch für andere Datenbanken eingesetzt werden könne.
00:39:00: So könnten in Zukunft Menschen die komplexen Inhalte von juristischen Texten
00:39:03: denjenigen zur Verfügung stellen, die sie am meisten benötigen.
00:39:06: Zum Schluss wollten wir von ihm auch noch wissen, welche Fähigkeiten aus seiner
00:39:09: Arbeit als Anwalt besonders hilfreich bei der Entwicklung von MyRights waren.
00:39:14: MyRights war gebaut, um den Leben der Bewerber einfacher zu machen.
00:39:17: Und als Bewerber weiß ich, welche Teile des legalen Forschungsprozesses Zeit braucht.
00:39:22: Zum Beispiel, wenn ein Klient in dein Büro kommt und ihre legalen Probleme darstellt,
00:39:26: dann muss man zuerst einen Fall finden, der ähnlich ist wie ihre legalen Probleme.
00:39:31: Die TechSearch-Funktion von MyRights macht das viel einfacher.
00:39:34: Nachdem ein User in seine TechSearch-Funktion einsteigt, wird er mit Fakten,
00:39:37: der Begründung und den Search-Highlights jedes einzelnen Falles vorgesehen.
00:39:41: Das ist wahrscheinlich der wichtigste Aspekt eines Fälls, wenn es um Initial Research geht.
00:39:45: Jetzt muss ein Nutzer nicht jedes Fälls untersuchen, um herauszufinden,
00:39:51: ob das Fälls relevant ist oder nicht. Das wird den Beratern viel Zeit versparen,
00:39:56: und ich nutze das persönlich in meinen Forschungen.
00:39:59: Ein anderes Problem, das ich gefunden habe, das ich nur als Berater gefunden
00:40:04: habe, war das Identifizieren der
00:40:06: Datenverleihungen in der Europäischen Gerichtshof Human Rights Database.
00:40:10: So konnte ich dafür sorgen, dass diese Daten-Labelung-Issue nicht in meine Rechte
00:40:14: fließen und die echten Daten korrigiert wurden, bevor sie in die Datenbüchse
00:40:19: eingeführt wurden. Ich glaube nicht, dass ich diese Art von Nuance finden könnte,
00:40:21: wenn ich kein Lawyer wäre.
00:40:22: Sein Wissen als Anwalt und seine Kenntnisse von juristischen Texten wären unersetzlich
00:40:26: für die Arbeit an MyRights, sagt Viraj.
00:40:28: Erstens kenne er sehr gut die Bedürfnisse von AnwältInnen bei der Suche in Datenbanken
00:40:32: und außerdem sei er in der Lage gewesen, auch die schwierigen Beschreibungen
00:40:36: aus der Datenbank des Europäischen Gerichtshofs für Menschenrechte zu entschlüsseln und in die aufzunehmen.
00:40:40: Vielen Dank an Virage für die Antworten auf unsere Fragen.
00:40:43: Und wie immer fragen wir uns auch nach dieser Folge, was haben wir mitgenommen?
00:40:46: Wie sieht es bei dir aus, Feli?
00:40:48: Ich habe gelernt, dass eigentlich jeder Quereinstieg eine Bereicherung für die
00:40:51: Open-Source-Hindernisse ist. Wenn alle ihre eigenen Expertise reinbringen,
00:40:54: wie zum Beispiel Virage oder Laura, dann können die Produkte einfach besser
00:40:56: werden, weil sie die Bedürfnisse dieser Gruppen besser kennen,
00:40:59: als zum Beispiel ein Developer.
00:41:01: Die Vielfalt steigert sich dann dementsprechend auch einfach und einfach her.
00:41:04: Und klar ist es auch ein bisschen scary, wenn man irgendwie keinen Background
00:41:07: hat mit Coden, aber es gibt auch immer eine Community, die ziemlich hilfsbereit
00:41:12: ist, wie wir schon gelernt haben.
00:41:13: Ich glaube, ich habe wahrgenommen, dass Open Source Entwicklung und Wissenschaft
00:41:16: einfach super gut zusammenpassen.
00:41:18: In beiden geht es eben darum, freies Wissen zu teilen und zu kollaborieren und zusammenzuarbeiten.
00:41:23: Und da ist Open Source Software einfach das perfekte Werkzeug für.
00:41:27: Ich selber wünsche mir, ich hätte das irgendwie schon früher gewusst,
00:41:30: dass das Open Source Software, dass man das auch als Wissenschaftler einfach
00:41:33: schreiben kann, denn ich habe selbst ein bisschen gecodet und habe das einfach
00:41:37: nie irgendwo sinnvoll veröffentlicht, weil es einfach nicht präsent war.
00:41:41: Also da ist auf jeden Fall irgendwie noch was zu tun, auch in der Awareness
00:41:44: bei den WissenschaftlerInnen.
00:41:47: Und ich glaube, der Punkt, der bei Virage mir am meisten hängen geblieben ist,
00:41:50: ist das, was du auch schon angesprochen hast.
00:41:52: Also Leute, die sich mit Problemen auskennen, sind auch die Leute,
00:41:56: die bei der Softwareentwicklung für diese Probleme involviert werden müssen,
00:41:59: damit man diese Probleme vernünftig lösen kann.
00:42:02: Das hätte jetzt niemand von außen machen können. Es hätte niemand ohne Biologiekenntnisse
00:42:06: GGET schreiben können und auch MyRights wäre ohne Kenntnisse im Recht einfach
00:42:10: nicht möglich gewesen, diese Software zu entwickeln.
00:42:14: Noch einmal vielen Dank an Laura und Viraj für eure Antworten auf unsere Fragen.
00:42:21: Und euch vielen Dank fürs Zuhören. Wie immer, wenn ihr mehr über uns erfahren
00:42:25: wollt, findet ihr alle Infos über uns auf protypefun.de.
00:42:28: Und wenn ihr keine Neuigkeiten verpassen wollt, dann abonniert unsere Newsletter
00:42:31: oder folgt uns auf Mastodon und Twitter.
00:42:34: Die Links dazu und auch zu allen anderen Dingen, die wir angesprochen haben,
00:42:37: findet ihr unten in den Show Notes.
00:42:39: Außerdem, wenn euch der Podcast gefallen hat, dann freuen wir uns über eine Bewertung.
00:42:43: Vielen Dank und tschüß!