Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

Feldbeschreibung

Eine Beschreibung des Inhalts.

PflichtJaTypStringFeldnamecclom:general_descriptionRedaktionshinweis
Info

Beschreibungstexte sind ein wesentlicher Bestandteil der Metadaten von Bildungsinhalten. Sie bieten einen prägnanten Überblick über den Inhalt und ermöglichen es Nutzern, schnell zu entscheiden, ob das Material für ihre Bedürfnisse relevant ist. In vielen Contentverwaltungssystemen gibt es verschiedene Arten von Beschreibungen, wie z.B. Kurzzusammenfassungen, detaillierte Inhaltsangaben oder Lernziele. Bei audiovisuellen Inhalten können zusätzlich Transkripte oder Untertitel als beschreibende Elemente dienen. Diese Seite gibt einen Überblick über den aktuellen Stand der Verwendung von Beschreibungstexten in der Bildungsinhalteverwaltung. Sie enthält praktische Empfehlungen für Redakteure und Entwickler sowie Einblicke in neue Entwicklungen im Bereich automatisch generierter Beschreibungen.

Inhalt der Seite:

Table of Contents

1. Verwendung in Standards und Applikationsprofilen

in Standards für Bildungsinhalte

  • Beschreibungen sind in allen Standards enthalten (s. Tabelle)

  • Manche stellen dazu gesondert noch die Kurzbeschreibung zur Verfügung

in Applikationsprofilen

  • Beschreibungen sind in allen Applikationsprofilen enthalten (s. Tabelle)

  • Manche stellen dazu gesondert noch die Kurzbeschreibung zur Verfügung

in WLO / edu-sharing-Lab:

  • cclom:general_description

2. Feldbeschreibung und Empfehlung

  1. Titel werden i.d.R. von den AutorInnen oder Herausgebern festgelegt und sollten nicht geändert werden und beim Crawlen von Inhalten korrekt generiert werden.

2.1. Empfehlungen

Die Beschreibung muss eine hohe Korrelation zu anderen Text-Metadaten aufweisen. Sie sollte länger als der Titel und nicht identisch sein. Schlagworte sollten sich in der Beschreibung wiederfinden.

Die Texte müssen in der jeweiligen Sprache im passenden Sprachniveau erstellt sein. Sie müssen grammatikalisch Sinn ergeben.

Die Beschreibung sollte häufige Suchbegriffe (Keywords) enthalten. Nutzer*innen, die nach dem Bildungsinhalt suchen, können ihn dadurch besser finden. Redakteur*innen geben in einem guten Beschreibungstext einen Überblick über den Bildungsinhalt und platzieren dabei die Keywords möglichst am Anfang der Beschreibung.

2.2 Redaktionelle Anleitung - Do's and Don'ts

2.3 Evidenz aus Nutzerfeedback und Tests

2.4 Handhabung bei edu-sharing Lab Version: WirLernenOnline

3.

Bisherige Generierung

Automatische Generierung

3.1 Stand der Generierung und Validierbarkeit

Die Beschreibung wird beim Upload in der Redaktionsumgebung manuell eingegeben. Crawler generieren den Text aus seitenspezifischen Inhalten.

CrawlerDatengrundlage

In den Crawlern wird die Beschreibung über das LOM abgedeckt.

Validierung

Eine Validierung des Fließtexts gegen einen Standard ist nicht möglich.

Die Beschreibung sollte mit anderen Text-Metadaten korrelieren, e.g., Titel, freie/feste Schlagworte. Die Sprache sollte zum Sprachniveau passen. Sie sollte frei von - offensichtlichen - Sprach- und Grammatikfehlern sein.

Generierungs- / Validierungskonzepte

Anforderungen

Die Beschreibung muss eine hohe Korrelation zu anderen Text-Metadaten aufweisen. Sie sollte länger als der Titel und nicht identisch sein. Schlagworte sollten sich in der Beschreibung wiederfinden.

Die Texte müssen in der jeweiligen Sprache im passenden Sprachniveau erstellt sein. Sie müssen grammatikalisch Sinn ergeben.

Lösungsideen / -konzepte

3.2 Anforderungen für aktuelle Weiterentwicklungen

  • Wie lang oder kurz muss eine Beschreibung sein? Mindestanzahl Zeichen/Wörter/Sätze?

    • Im MetaQS Tool wird derzeit eine Grenze von Seiten der Developer definiert. Eine Beschreibung muss länger als 30 Zeichen lang sein, sonst gilt sie als nicht vorhanden

  • Muss eine Beschreibung einzigartig sein? Oder darf es sie mehrfach geben, e.g. "Fülle die Felder aus"?

  • Eine Beschreibung muss sprachlich verständlich (s. Sprachliche Verständlichkeit) sein. D.h. sie genügt grammatikalischen Anforderungen.

    • Hat sie eine Maximalanzahl von Schreibfehlern? Dies kann mit dem LanguageTool geprüft werden.

    • Ob ein Satz grammatikalisch korrekt ist, kann mit BERT überprüft werden. Ggf. muss nachtrainiert werden, bspw. mit ULMFIT

  • Durch die Redakteur:Innen definiert: Dokument

3.3 Generierungs- u. Validierungsideen u. Konzepte

Die Beschreibungstexte können entweder direkt aus dem Volltext der gecrawlten Seite oder aus Schlagwörtern und Titel generiert werden.

Wir bevorzugen ersteres, da Titel und Schlagwörter ggf. auch aus dem Volltext generiert wurden. Eine Möglichkeit weitere Informationen bzgl. Volltext etc. aus einer Quelle zu extrahieren könnte neben Scrapy mit dem Tool Travilatura geschehen. 

PoC's

Technisch triviale Beispiele werden direkt am Code von MetaLookup diskutiert.
Ein erster PoC ist ebenfalls bei MetaLookup vorgestellt.

Metriken

Das OpenSource-Tool SpaCy bietet inherent Möglichkeiten die Ähnlichkeit von Texten zu berechnen.

Die contributors

Die berechnete Kosinus-Ähnlichkeit ist ein guter Indikator, welche weiterfühernde Schritte an der Beschreibung nötig sind. Werte um 0 oder kleiner sowie nahe 1 deuten auf eine ungenügende Beschreibung hin. Idealerweise sind Beschreibung sowie Titel & Co. ähnlich, aber weder identisch noch unkorreliert. 

Die minimale und maximale Länge in Zeichen ist relevant.

<< Zurück zur Startseite / Gesamtinhaltsverzeichnis

Inhalt dieser Seite:

Table of Contents

Auf dieser Seite schrieben:

Eine Validierung des Fließtexts gegen einen Standard ist nicht möglich.

Die Beschreibung sollte mit anderen Text-Metadaten korrelieren, e.g., Titel, freie/feste Schlagworte. Die Sprache sollte zum Sprachniveau passen. Sie sollte frei von - offensichtlichen - Sprach- und Grammatikfehlern sein.