Content-Mining. Weiterer Fortschritt beim Open Access.

Das Nature Magazin hat von allen publizierenden Plattformen den höchsten Impact. Hier werden Arbeiten veröffentlicht, die das Potential haben, die Wissenschaft ein gutes Stück voran zu bringen. Leider sind die Paper üblicherweise kostenpflichtig, sodass nur ein auserwählter Kreis diese aus ersten Hand lesen kann. Bei den anderen großen Verlagen sieht es natürlich auch nicht unbedingt besser aus.
Dementsprechend war ich schon überrascht, dass dieses Paper öffentlich ist –  auch wenn Gegenteiliges bei dem Titel schon recht albern gewesen wäre: Elsevier opens its papers to text-mining.

Es geht darum, dass Lesern die Arbeit mit den Daten in den Papern erleichtert werden soll – auf die sie ohnehin eigentlich vollen Zugriff haben sollten.
Bislang war es nämlich so, dass die Paper zwar einzeln runtergeladen und ausgewertet werden konnten, aber es war nicht möglich, automatisierte Routinen zu implementieren, die bestimmte Paper nach den benötigten Daten durchsucht haben. Diese Automatisierung wäre das Text- oder auch Content-Mining und sie ist überaus nützlich, da viele Paper Ergebnisse enthalten, auf die sie nicht weiter eingehen – quasi nur im Nebensatz erwähnen oder der Titel scheint auf einen ganz anderen Inhalt einzugehen. Somit gehen Erkenntnisse unnötig verloren.

Nun soll bei den großen Verlagen möglich werden, was bei Open Access schon längst geht. Warum die großen Verlage Angst vor automatisierten Analysen haben, kann ich nicht sagen. Es ist auf jeden Fall ein Schritt in die richtige Richtung, auch wenn nachwievor viele Restriktionen bleiben werden: Nur 10.000 Paper pro Woche und User, es muss vorher einer Vereinbarung zugestimmt werden und einiges mehr.

Eines der ersten Projekte, das diese „neue Freiheit“ ausnutzen möchte, will das Wissen über das menschliche Gehirn zusammentragen, um neue Erkenntnisse aus Altbekanntem zu finden.

 

—-

weiterführender Link

3 Kommentare

  1. Ich bin absolut sprachlos, dass dies im Jahre 2014 als Neuheit in die Öffentlichkeit kommt.

    Aber immerhin. Wie weit sind eigentlich die Digitalisierungen der Papier-Archive bei den Verlagen?

    Das Interesse am Gehirn scheint seit einiger Zeit steil anzusteigen.

  2. Hi,

    ich hab mir mal als Stichprobe einen Artikel aus der Nature Erstausgabe angeguckt: „Die Hirnwindungen des Menschen“ Nature 1, 18-18 (04 November 1869)

    Man kann sich den ersten Absatz angucken, sodass das Paper wohl gescannt geworden ist, aber reingucken kann man natürlich nicht.
    http://www.nature.com/nature/journal/v1/n1/abs/001018a0.html

    Ähnlich sieht’s auch bei anderen zufällig angeklickten Paper der letzten Jahrzehnte aus. Abstract und PDF-Version scheinen vorhanden zu sein, aber Zugriff natürlich nicht.

    Ich denke mal, dass das Scannen auch bei anderen Verlagen abgeschlossen sein sollte – auch wenn es nur wenigen wirklich helfen wird, denn was die Texterkennung angeht, werden bestimmt nicht alle aufbereitet worden sein (persönliche unbelegte Einschätzung), sodass das Content-Mining hier stocken wird.

  3. “Die Hirnwindungen des Menschen” Nature 1, 18-18 (04 November 1869)

    -> Also das ein steiler Anstieg zu erkennen sei, mag dann wohl nicht so deutlich stimmen. Das Thema ist ein Dauerbrenner.
    Ich hatte es eigentlich gewusst; nur vergessen.

Schreibe einen Kommentar zu threepoints... Antworten abbrechen

Deine E-Mail-Adresse wird nicht veröffentlicht.


*