The World Atlas of Language Structures Online

Forschungsdaten in der Linguistik

Inhalt

  1. Mosaikstein 1: WALS Online
  2. Vom Buch zur Webanwendung
  3. Resultate
  4. Forschungsdaten in der Linguistik
  5. Mosaikstein 2: WOLD
  6. Das Grosse Ganze
  7. Die Rolle von Bibliotheken?

In diesem Vortrag sollen beispielhaft Aktivitäten der MPDL im Bereich des wissenschaftlichen Datenmanagements vorgestellt werden.

Dabei will ich vom Mikroblick einer einzelenen Datenpublikation über disziplinspezifische Apekte zur Makroperspektive des "Web of Data" übergehen.

Im besten Fall können damit Denkanstösse oder Hinweise auf relevante Technologien gegeben werden. Inwieweit Aktivitäten wie die beschriebenen zur Rolle von Bibliotheken gehören können oder gar sollen, wird die Zukunft zeigen.

Die MPDL als Mikroverlag

Weiterführende Links

  • MPDL
  • Unter dem Living Reviews Schirm werden 5 Open Access, online only journals publiziert.
  • Das Living Sources Portal soll übergreifende Services für die Datenpublikationen der MPDL zugänglich machen.

WALS Online

Vom Buch zur Webanwendung

2008 WALS Online: OUP stimmt einer Publikation auch der Kapiteltexte zu.

Die Webanwendung betont den Datenbankcharakter etwas mehr, verlässt sich aber weiterhin auf "Buchähnlichkeit", um traditionelle Mechanismen der wissenschaftlichen Anerkennung zu ermöglichen.

Medienwechsel als Strategie

  1. Buchpublikation
  2. Online Datenbank
  3. ???
  4. PROFIT!!!

Etablierung einer Marke durch herkömmliche Publikationskanäle.

Resultate

Was bedeutet die online, Open Access Publikation für derartige Daten?

Nutzung des Webangebots

http://wals.info/ erhält mehr als 1.000.000 hits pro Monat (zu einem grossen Teil von Suchmaschinen, die aber wiederum Nutzung generieren). (siehe http://dev.livingreviews.org/webstats/wals/current/).

Über die feedback-Funktionalität der blog Komponente wurden in den letzten 20 Monaten mehr als 240 Kommentare abgegeben - zumeist sehr qualifiziert, häufig mit Referenzen, und meist sehr spezifisch. (siehe etwa http://blog.wals.info/datapoint-121-wals_code_apl/#comment-20876 ).

Wenn Nutzung tatsächlich (wie öfters postuliert) positiv mit Stabilität und Verfügbarkeit korreliert (z.B. arxiv), sind das gute Zahlen!

Markenbildung

WALS Online muss nicht als Konkurrenz für traditionelle Verlage gesehen werden, sondern kann umgekehrt als erwünschter Beitrag einer Forschungsinstitution zum Datenangebot gesehen werden, wie folgendes Zitat aus einem referee report für ein Buchpprojekt zeigt:

The WALS online site and the Loanword Typology site are already building up the MPI as a great “brand” for online linguistic databases.
[...]
An additional positive feature of the proposed project is how it both builds on WALS and will add substantial new information and data in its own right. As such, its publication will not only enhance WALS (and allow WALS to in turn enhance it), but it will also represent a significant intellectual advance over WALS, based on many lessons learned during the development of WALS and after. This is more than “WALS for pidgins and creoles”: it will mark a new landmark in cross-linguistic research and a model for any future project with similar aims.

Weitere Nachnutzung

Forschungsdaten in der Linguistik

Was zeichnet Forschungsdaten in der Linguistik in Hinsicht auf Online Publikation aus?

* word lists * dictionaries * typologische datenbanken * referenzen-datenbanken

Mosaikstein 2: WOLD

The World Loanword Database

Ist das Buch+Datenbank Modell die Entsprechung zu ersten article+dataset Beispielen (oder schon repositories) in den Naturwissenschaften (etwa dryad siehe dryad wiki und dryad repository)?

Web of Data

Weiterführende Links

linked data

Ein Bauplan für das Datenweb

Weiterführende Links

Zum Potential des Semantic Web

aka web of data, aka linked data

Cecil Brown in "Hand and Arm":

... The presence of tailored clothing covering the arms greatly increases the distinctiveness of arm parts and renders more likely their labeling by separate terms ...
... Another potentially fruitful investigatory strategy would be to cross-tabulate values against the tailoring technologies of peoples who speak each of the 620 languages of the sample - an enormous research effort this author must leave to future investigators ...

Sprache -> Sprecher -> Schneider-Techniken: Ein Fall für DBPedia!

Weiterführende Links

Die Rolle von Bibliotheken?

Weiterführende Links

Lessons learned?

Fin

Fragen?

http://dev.livingreviews.org/presentations/bibtag2010/

forkel@mpdl.mpg.de