header-newsletter-password

Open Password - Freitag, den 25. Juni 2021

# 939
Marianne Englert - FAZ - Digitalisierung - Fachgruppe 7 - Marianne-Englert-Preis - vfm - ISI 2021 – Information Retrieval – Informationskompetenz – Google – Willi Bredemeier – Proceedings – Virtuelle Events – Dirk Lewandowski – Suchmaschinenkompetenz – Sebastian Schultheiß – Anzeigen - Suchmaschinenoptimierung – Suchmaschinenwerbung – Ranking – Bibliotheken – Kollaborative Informationssuche – Carolin Schulz – Stefanie Elbeshausen – Christa Wormser-Hacker - Saleem Amershi – Meredith Morris – Driver – Observer – Relevanz – Sebastian Sünkler - Algorithmus – Suchmaschinenforschung – Reputation von Quellen – Qualität von Texten - DGI – Virtueller DGI-Stammtisch – Informationsvermittlung in Zeiten der Distanz – Corona – Wissensorganisation 2021 – Indexing – Knowledge Graphs – DGI-Online-Seminare - Christoph Haxel - Artificial Intelligence Conference - Search - Data and Text Mining - Analytics - Visualization

I.
Marianne Englert 1926 - 2021

II. Titelgeschichte:
Information Retrieval. Informationskompetenz muss vor allem aus einem kompetenten Umgang mit Google bestehen

III. DGI
Informationsvermittlung in Zeiten der Distanz

IV. Nizza
The Artificial Intelligence Conference on Search, Data and Text Mining, Analytics and Visualization

Marianne Englert 1926 – 2021

Marianne Englert ist gestorben. Die erste Archivleiterin der 1949 gegründeten Frankfurter Allgemeinen Zeitung begleitete und unterstützte 42 Jahre lang die Redaktion bei ihrer täglichen Arbeit (1950 – 1992). Sie baute ein leistungsfähiges Archiv auf und setzte dabei neue Maßstäbe für Medienarchive. Früh erkannte sie die beginnende Digitalisierung als neue Chance und Herausforderung für die Berufsbranche.

Frau Englert war von 1965 – 1989 Vorsitzende der Fachgruppe der Medienarchivare im Verein deutscher Archivare (Fachgruppe 7). Später wurde sie Ehrenvorsitzende des vfm (Verein Fortbildung für Medienarchivare/dokumentare) und der fg7, Mitautorin des Berufsbildes des Medienarchivars/-dokumentars und Leiterin der „Arbeitsgemeinschaft Fortbildung“. Der vfm benannte seinen Preis nach ihr, mit der er seit 2012 jährlich Studierende und Absolventen aus den Bereichen Information, Dokumentation, Archiv und Bibliothek auszeichnet.

Eine ausführlichere Würdigung von Marianne Englert befindet sich in Vorbereitung.
ISI 2021:
Information Retrieval


Informationskompetenz muss vor allem
aus einem kompetenten Umgang
mit Google bestehen

Von Willi Bredemeier

Ich konnte die Sitzung „Information Retrieval“ auf der ISI 2021 nur teilweise am Bildschirm miterleben, weil ich zwischenzeitlich aus persönlichen Gründen abgerufen wurde. Meine Wissenslücken suchte ich durch eine Lektüre in den Proceedings auszugleichen. Während ich las, kam mir die Frage: Wozu bedarf es eines virtuellen Events, wenn es die Proceedings gibt? Ah ja, die „Discussions“ und die „Panels“. Gleichwohl bleibt dies eine ernsthafte Frage und vielleicht ein Ansporn, den Mehrwert virtueller Events in Echtzeit immer wieder sicherzustellen.
Dirk auf Podium
Fast ein Lewandowski-Festival:
HAW-Forscher Dirk Lewandowski


Wie sich in der Session „Information Retrieval“ herausstellte, handelte es sich um eine Art „Lewandowski-Festival“, da drei von vier Beiträgen von ihm und seinen Mitautoren stammten. Selbst dann, wenn man das dritte und vierte Referat, was naheläge, zusammenlegen würde, betrüge das Verhältnis von Lewandowski u.a zu anderen Autoren noch immer 2:1. Ist dies ein Indiz dafür, dass in der deutschsprachigen Informationswissenschaft nach wie vor größere Kooperationspotenziale zu mobilisieren sind? In der Sitzung wurde für Deutschland repräsentativ bestätigt, dass Suchmaschinen-Nutzer dazu tendieren, ihre Kompetenzen weitgehend zu überschätzen.
__________________________________________________________________________________

Überschätzung der eigenen Suchmaschinenkompetenz repräsentativ bestätigt.
__________________________________________________________________________________


Nutzer schätzen ihre eigene Suchmaschinenkompetenz typischerweise als hoch ein, unterliegen damit aber einem Fehlschluss. Dies wurde ein weiteres Mal diesmal durch eine repräsentative Untersuchung von Sebastian Schultheiß und Dirk Lewandowski bestätigt („(Un)bekannte Akteure auf der Suchergebnisseite? – Ein Vergleich zwischen selbst eingeschätzter und tatsächlich vorhandener Suchmaschinenkompetenz deutscher InternetnutzerInnen“). Hier schätzten 84% der Befragten ihre Suchmaschinenkompetenz als gut ein, davon 32% als „sehr gut“.

In Wahrheit verstehen viele Nutzer, wie auch in dieser Untersuchung gezeigt wurde, den Unterschied zwischen Anzeigen und organischen Suchmaschinenergebnissen nicht. Damit können sie die dargebotenen Ergebnisse auf ihre Suchen nicht durch ein Wissen über Suchmaschinenoptimierung und Suchmaschinenwerbung relativieren. Im Gegenteil, eine Mehrheit sieht die Suchmaschinen als vertrauenswürdige Informationsquelle an und vertraut insoweit dem Ranking der Suchmaschinenbetreiber, als sie nur die ersten Ergebnisse, wenn nicht überhaupt nur das erste Resultat, zur Kenntnis nimmt.

Angesichts der Mitbestimmung des täglichen Lebens nahezu aller Bürger durch Suchmaschinen, sprich Google, sollte eine Vermittlung von Informationskompetenz vor allem aus einer Kompetenz im Umgang mit Google bestehen. In einer Befragung von 80 Bibliotheken zu ihren Maßnahmen zur Erhöhung der Informationskompetenz wurden jedoch häufiger andere Schwerpunktthemen als die Internetrecherche behandelt, so die Bibliotheksnutzung, Datenbanken und sogar die Fernleihe.
Die Autoren folgerten: „Eine Förderung der Suchmaschinenkompetenz ist somit entscheidend dafür, den über Suchmaschinen erfolgenden Wissenserwerb der InternetnutzerInnen auf eine fundierte Basis zu stellen. Im Kontext der Informationskompetenz wird Suchmaschinenkompetenz allerdings kaum berücksichtigt. … Die Schulung von Informationskompetenz (muss) gerade dort ansetzen, wo NutzerInnen in ihrem Alltag suchen, nämlich bei den kommerziellen Suchmaschinen. Wenn sie anhand dieser Systeme auch ihre Kompetenzdefizite erkennen, dürften sie auch offener für weitergehende Schulungen beispielsweise zur Auswahl und Verwendung spezieller Datenbanken sein.“
___________________________________________________________________________

In der kollaborativen Informationssuche tragen Alte und Junge gleichermaßen zu den Entscheidungen bei.
___________________________________________________________________________


Wie wird ein sehr enges („kollaboratives“) Zusammenwirken in der Informationssuche zwischen alten und jungen Menschen durchgeführt? Diese Frage suchten Carolin Schulz, Stefanie Elbeshausen und Christa Wormser-Hacker mit Videos entsprechender Suchen nach Reiseinformationen und zusätzlichen offenen Interviews zu beantworten („Kollaboratives Informationssuchverhalten von Personen unterschiedlicher Generationenzugehörigkeit“). Die Autorinnen interessierten sich vor allem für das Rollenverhalten der Beobachteten und ob eine der Suchenden im Suchprozess eine Leitungsfunktion übernahm.

Die Ergebnisse scheinen vor allem eine Studie von Amershi und Morris aus dem Jahr 2008 zu bestätigen und nicht allzu weit von unserem Alltagsvorverständnis entfernt zu sein: „Die junge Generation spiegelt sich in der Rolle des drivers wider, da sie die Kontrolle über das technische Gerät hat. Die ältere Generation lässt sich in die Rolle des observers einordnen, da sie zuschaut und Vorschläge gibt.“ Demnach gibt es für die Zusammenarbeit zwischen Angehörigen unterschiedlicher Generationen „unterschiedliche Kollaborationsausprägungen: Im Hinblick auf die Vertrautheit mit Technik und die Expertise ist das Verhältnis zwar asymmetrisch, in Bezug auf die Autorität der Kollaborateure ist jedoch eine symmetrische Ausprägung vorhanden.“

Allerdings versuchen die Autorinnen auch, die Relevanz ihrer Studie zu belegen: „So ließe sich auch auf längere Sicht ermöglichen, dass unterschiedliche Generationen pandemieresistent zusammenarbeiten und voneinander profitieren können.“ Das wäre sicherlich wünschenswert. Ich kann allerdings nicht nachvollziehen, wie diese und ähnliche Studien dazu beitragen können.
__________________________________________________________________________________

Ist mein Text am Bildschirm suchmaschinenoptimiert? Das kann sehr wahrscheinlich und weniger wahrscheinlich sein.
__________________________________________________________________________________

Suchmaschinenforschung ist zu einem beträchtlichen Teil ein Ratespiel, da das Ranking der Suchergebnisse von einem Algorithmus vorgenommen wird, der nur dem Suchmaschinenbetreiber bekannt ist. Suchmaschinenforschung ist sogar ein doppeltes Ratespiel insoweit, als die Existenz vieler Unternehmen davon abhängt, dass ihre werbenden Informationen an vorderen Stellen in den Suchmaschinenergebnissen angezeigt werden. Diese müssen daher versuchen, den vermuteten Präferenzen des Algorithmus durch eine entsprechende Gestaltung ihrer Texte (= Search Engine Optimisation/SEO) zu folgen. Mittlerweile hat sich eine Branche für SEO herausgebildet, die 2020 allein in den USA einen Umsatz von 80 Milliarden Dollar erreicht haben soll. Nach Studien von Sebastian Sünkler und Dirk Lewandowski waren 90% der von ihnen untersuchten Suchergebnisse wahrscheinlich suchmaschinenoptimiert („Den Einfluss der Suchmaschinenoptimierung messbar machen – Ein halbautomatisierter Ansatz zur Bestimmung von optimierten Ergebnissen auf Googles Suchergebnisseiten“).

Bedeutet das, dass Versuche der Suchmaschinenoptimierung meistens erfolgreich sind? Keineswegs, wenn SEO zur üblichen professionellen Gestaltung kommerzieller oder kommerziell getriebenen Texten für das Internet gehört, so dass außerhalb privater und zivilgesellschaftlicher Bereiche fast nur suchmaschinenoptimierte Texte untereinander in Wettbewerb um die vorderen Plätze treten würden und die Wahrscheinlichkeit, dass ein vorliegender Text suchmaschinenoptimiert ist, nahe bei 1 läge. Auch dürfte das Ranking der Suchmaschinenergebnisse von anderen Faktoren als der Suchmaschinenoptimierung bestimmt werden, zum Beispiel bislang unerkannte Vorlieben des Algorithmus, Entscheidungen der Suchmaschinenbetreiber und ihr Verlangen, ihre weiteren eigenen Angebote an hervorragender Stelle zu positionieren, sowie die Reputation von Quellen und womöglich sogar die tatsächliche Qualität von Texten.

Kommen wir zu dem Referat von Sünkler/Lewandowski auf der ISI2021, das auch als Darstellung von als in Details gehendem „Research in Progress“ bezeichnet werden kann. In ihrem Abstract stellen die Autoren ihre Arbeiten so dar (Die in Klammern gesetzten Beispiele und Erläuterungen beziehen sich auf ihren weiteren Text.): „Für die Untersuchung über den Einfluss von SEO auf die Suchergebnisse haben wir halb-automatische Prozesse und ein Software-Framework entwickelt, das mit einem regelbasierten Klassifikator die Wahrscheinlichkeit von Optimierungsmaßnahmen auf Suchergebnisse ermittelt.“ Der Ansatz basiert auf 20 Merkmalen, zu denen die Analyse zum Beispiel über folgende Größen gehören: genutzte SEO-Plug-Ins und Analytics Tools, z.B. Google Analytics - URL-Listen, zum Beispiel die Kunden von SEO-Agenturen sowie Unternehmens-Webseiten und Webseiten mit Werbung - die Auswertung technischer Indikatoren wie die Ladegeschwindigkeit (These: „Wenn der Wert unter drei Sekunden liegt, ist das ein Indikator für optimierte Inhalte“) - die Verwendung bestimmter Tags, z.B. zur Deskription sowie eine manuelle Klassifikation auf Basis vorab zusammengestelltet Listen mit optimierten und nicht optimierten Webseiten. Je mehr diese Merkmale für ein Dokument gegeben sind, desto wahrscheinlicher ist es, dass dieses Dokument suchmaschinenoptimiert wurde.

Sünkler/Lewandowski legten sodann Regeln fest, „ob ein Dokument höchstwahrscheinlich optimiert, wahrscheinlich optimiert, wahrscheinlich nicht optimiert oder höchstwahrscheinlich nicht optimiert ist.“ In der zuletzt genannten Kategorie befindet sich, „da unser Ansatz noch in Entwicklung ist“, nur Wikipedia, „da von Wikipedia bekannt ist, dass dort keine aktiven SEO-Maßnahmen genutzt werden.“

Der Ansatz von Sünkler/Lewandowski wurde auf drei Datensätzen (zu Google-Trends, rechtsradikalen Inhalten und Corona) mit insgesamt 2.043 Suchanfragen und 263.790 Ergebnissen angewendet. „Die Ergebnisse zeigen, dass ein großer Teil der in Google gefundenen Seiten zumindest wahrscheinlich optimiert ist, was im Einklang mit Aussagen von SEO-Experten steht, die sagen, dass es sehr schwierig ist, ohne die Anwendung von SEO-Techniken in Suchmaschinen sichtbar zu werden.“

Folgen wir Sünkler/Lewandowski, so können wir jetzt ermitteln, welche Suchmaschinenergebnisse wahrscheinlich oder weniger wahrscheinlich optimiert wurden. Das kann, wenn man an der pragmatischen Nutzung von Forschungsergebnissen interessiert ist, nur ein Zwischenschritt sein. Sagen die Ergebnisse auch etwas darüber aus, „ob der Einfluss der Suchmaschinenoptimierung sich positiv oder negativ auf die Ergebnisqualität auswirkt“? Die Autoren: „Für solche Analysen müsste die Methodik beispielsweise durch Retrievalstudien, in denen Juroren die Qualität der Suchergebnisse bewerten, bestimmt werden.“
__________________________________________________________________________________

Ein Tool zur Bestimmung der Wahrscheinlichkeit von Suchmaschinenoptimierung auf einer Webseite.
__________________________________________________________________________________


Sebastian Sünkler und Dirk Lewandowski haben im Rahmen ihrer oben vorgestellten Studie ein SEO-Tool entwickelt, das „die Wahrscheinlichkeit von Suchmaschinenoptimierung auf einer Webseite“ ermittelt. Eine Demo des Tools ist unter http://5.189.20:5000 verfügbar.
DGI-Veranstaltungen

Informationsvermittlung in Zeiten der Distanz

Virtueller DGI-Stammtisch, 13. Juli, 18 - 20 Uhr, online


DGI-Forum 2021 - Informationsvermittlung in Zeiten der Distanz, 28. und 29. Oktober, online
- im unmittelbaren Anschluss daran: CfP - Wissensorganisation 2021, Digitization and knowledge organization: between indexing and knowlege graphs?

DGI-Online- Seminare Sommer 2021:
Schreibwerkstatt - Instagram:30. Juni, 9:30-13:00, online, M. Borchardt
Schreibwerkstatt - Facebook: 1. Juni, 9:30-13:00, online, M. Borchardt
Social Media und Öffentlichkeitsarbeit I: 7. Juli, 9:30-13:00, online, P. Landes
Social Media und Öffentlichkeitsarbeit II: 8. Juli, 9:30-13:00, online, P. Landes
Social Media und Recherche: 12. Juli, 9:30-13:00, online, Chr. Rahner-Göhring
Digitalfotografie für Social Media und Webseiten I: 13. Juli, 9:30-13:00, online, M. Borchardt
Digitalfotografie für Social Media und Webseiten II; 14. Juli, 9:30-13:00, online, M. Borchardt
Schreibwerkstatt – Websites: 6. September, 9:30-13:00, online, M. Borchardt
Schreibwerkstatt – Blogs: 7. September, 9:30-13:00, online, M. Borchardt
Christoph Haxel

The Artificial Intelligence Conference on Search,
Data and Text Mining,
Analytics and Visualization

Dear Colleagues

The Preliminary Programme is published and looks excellent.

There are only 3 free speaking slots available for speakers and 3 free places available for exhibitors. The Super Early Bird Registration is open ... book now and save money.

I keep my fingers crossed and I am looking forward to seeing you in nice Nice or meeting you with Zoom.

With kind regards Christoph Haxel

The Programme:

Monday 4. October 2021

Conference starts at 09:00Opening by Christoph Haxel (Dr. Haxel CEM, Germany)Ping Pong – Playful Knowledge Transfer
Vanessa Lage-Rupprecht (Fraunhofer Institute for Algorithms and Scientific Computing SCAI, DE), Marc Jacobs (Fraunhofer Institute for Algorithms and Scientific Computing SCAI, DE)

AILANI for clinical competitive landscaping
Angela Bauch (Biomax Informatics, Germany)

New Product Introductions: Biomax INFORMATICS // DEEP SEARCH 9 // CENTREDOCExhibition and Networking BreakIntegrated Artificiel Intelligence – A Factory Progress Report
Harald Jenny (CENTREDOC, Switzerland)

AI is Not Magic: Part II
Srinivasan Parthiban (VINGYANI, India)

New Product Introductions: Lighthouse IP // Search Technology / VantagePointLunch, Exhibition and Networking Synonym and AI
Jay Ven Eman (CEO, Access Innovations, USA)

New Product Introductions: DolceraExhibition and Networking BreakThe secret of successful CI: precise targeting + immediate discovery
Klaus Kater (Deep SEARCH 9, Germany )

Tuesday 5. October 2021

Conference starts at 09:00Semantic Search and Content Management – Case Studies in Successful Software Implementations
Marjorie Hlava (Information Access, USA)

Project Management Challenges for IP Projects
Lucy Antunes (CAS IP Services, USA), Muriel Bourgeois Tassanary (MT-IP Consulting, FR)

Exhibition and Networking BreakMachine learning tools in patent searching - are we on the right track?
Heiko Wongel (Wongel IP)

Leveraging pre-trained language models for document classification
Holger Keibel (Karakun, Switzerland), Elisabeth Maier (Karakun, Switzerland)

LunchAI – Who is in control and why is that important?
Nils Newman (Search Technology, USA)

Exhibition and Networking BreakNews from Pateninformatics - Title is coming soon.
Tony Trippe (Patinformatics, USA)

Closing Remarks - Christoph Haxel

Open Password

Forum und Nachrichten
für die Informationsbranche
im deutschsprachigen Raum

Neue Ausgaben von Open Password erscheinen viermal in der Woche.
Wer den E-Mai-Service kostenfrei abonnieren möchte - bitte unter www.password-online.de eintragen.
Die aktuelle Ausgabe von Open Password ist unmittelbar nach ihrem Erscheinen im Web abzurufen. www.password-online.de/archiv. Das gilt auch für alle früher erschienenen Ausgaben.

International Co-operation Partner:

Outsell (London)
Business Industry Information Association/BIIA (Hongkong)
header-newsletter-password
Open Password - Redaktion - PASSWORD - Redaktionsbüro Dr. Willi Bredemeier
Erzbergerstr. 9-11
45527 Hattingen
Tel.: (02324) 67009
E-Mail: w.bredemeier@password-online.de