Digikam 7.0: Gesichtserkennung kommt zum Hund

Digikam ist eine datenbankgestützte Bildverwaltung für anspruchsvolle Benutzer, mit der sehr große Bildersammlungen organisiert und die Bilder durch Auswertung von Meta-Tags leicht durchsucht werden können. Vor einigen Tagen veröffentlichten die Digikam-Entwickler die Version 7.0 der Fotoverwaltung im Quellcode, nahmen sich jedoch Zeit für die offizielle Präsentation und die Versionshinweise.

Verpassen Sie keine Neuigkeiten! Mit unserem täglichen Newsletter erhalten Sie jeden Morgen alle wichtigen Online-Nachrichten der letzten 24 Stunden.

Abonnieren Sie jetzt den Newsletter

Während dieser Verzögerung handelte es sich um eine Fehlerbehebung, die anschließend beim Erstellen der verschiedenen Binärpakete auftrat. Nach fast 20 Jahren Entwicklungszeit ist Digikam nicht mehr nur ein Aushängeschild der KDE-Arbeitsumgebung unter Linux, sondern auch als Port für Windows und Mac OS X. Digikam 7.0 ist jetzt auch als Flat-Package für Linux-Systeme verfügbar.

Umzug nach Gitlab

Die Entwickler haben wie die anderen zentralen KDE-Projekte die Quellcodeverwaltung vollständig von mehreren einzelnen Tools wie Phabricator und Bugzilla auf Gitlab verlagert. Digikam ist die erste Version des Fotomanagements, die auf der KDE-Projektwebsite auf Gitlab zu finden ist. Für die engen Teilprojekte von KDE wurden die verschiedenen zuvor verwendeten Einzelwerkzeuge zu einer Menge Arbeit, und Gitlab fasst jetzt viel zusammen. Der Umzug von KDEs und seinen Anwendungen war einige Monate in Vorbereitung und wurde mit Gitlab abgeschlossen Aktivitätsübersicht gefeiert.

Für Digikam-Entwickler stellt der Umfang des Digikam-Quellcodes auf Gitlab eine Reihe von Hürden dar. Laut Gilles Caulier, einem der Hauptentwickler des Projekts, verursacht die GitLab-Instanz des KDE-Teams am CI derzeit Kompilierungsprobleme. Sobald das Programm aufgelöst ist, sollte die neue Entwicklungspipeline auch auf CD erweitert werden und die abgeschlossenen Digikam-Builds schneller liefern.

Gesichtserkennung: zuverlässiger mit neuronalen Netzen

Die wichtigste Neuerung, die in der ersten Beta im Dezember letzten Jahres als Highlight dieser Version herauskam, ist eine neue Gesichtserkennung. Seit Digikam 2.0 umfasst die Fotoverwaltung Algorithmen zum Erkennen und automatischen Markieren von Personen in Bildern. Die Algorithmen basierten auf „Cascade Classifiers“ von Intels OpenCV-Bibliothek, blieb bis zur aktuellen Version 7.0 weitgehend unverändert und ließ hinsichtlich der Präzision zu wünschen übrig: Die Digikam-Entwickler erhielten von OpenCV eine Erkennungsrate von rund 80 Prozent. Was sich nach einer beeindruckend hohen Rate anhört, ist für den täglichen Gebrauch zu wenig, wie das Feedback der Benutzer im Bug-Tracker gezeigt hat.

Statue 1 von 9

Die neue DNN OpenCV-Gesichtserkennung in Aktion: Digikam 7.0.0 erkennt unabhängig voneinander Porträts von Menschen und Tieren und schlägt dann die manuelle Kategorisierung dieses Bildmaterials nach Namen vor. Weitere Läufe enthalten dann diese Muster.
(Bild: David Wolski)

Im Rahmen des „Google Summer of Code“ begann Digikam 2017 mit der Gesichtserkennung über neuronale Netze und mit Studenten die C ++ – Bibliothek Dlib verbessern. Diese Methode ergab eine höhere Erkennungsrate, war jedoch zu langsam: Die Erkennung von Gesichtern in Bildern mit 112 x 92 Pixeln dauerte nach Angaben der Entwickler etwa 8 Sekunden. In einem neuen Projekt für den Google Summer of Code 2019 gelang der Durchbruch mit dem Deep Neural Network-Modul der neueren OpenCV-Bibliothek. Diese Methode ist jetzt in Digikam 7.0 enthalten und liefert laut Versionshinweisen dank Multithreading eine Erkennungsrate von 97 Prozent bei einer akzeptablen Rate.

Ein weiterer Vorteil ist, dass die neue Erkennung nicht auf menschliche Gesichter beschränkt ist. Das in Digikam 7.0 vorab trainierte Erkennungsmodell erkennt auch die Porträts von Haustieren, beispielsweise Hunden. In einem Video der KDE-Veranstaltung „Akademy 2019“ erklärt der Entwickler der neuen Entdeckung weitere Details des Deep-Learning-Modells und Pläne für diese Digikam-Komponente.

Trung Thanh Dinh – AI Gesichtserkennung mit OpenCV in digiKam – Akademie 2019

Nach wie vor erfordert die Gesichtserkennung zunächst die manuelle Definition von Personen auf einem Foto mithilfe von Tags. OpenCV vergleicht dann die bereits erkannten, nicht zugewiesenen Gesichter mit den bereits markierten Personen. Die neu erkannten Gesichter in neu hinzugefügten Fotos werden den Benutzern zur Bestätigung in einer Vorschau angezeigt. Der Workflow ist daher halbautomatisch. Die neue Methode funktioniert ab dem ersten getaggten Gesicht, wird jedoch mit mehr angehängten Tags immer genauer.

Libraw 2.0: Unterstützung für neue RAW-Formate

Der zweite wichtige Teil der Innovationen in Digikam 7.0 ist die umfassende Unterstützung herstellerspezifischer RAW-Formate. Die Bildverwaltung konkurriert nicht mit RAW-Entwicklungstools wie RawTherapee oder Darktable, soll jedoch zumindest das Anzeigen neuer Fotos erleichtern und schnelle Korrekturen wie den Weißabgleich ermöglichen. Digikam verlässt die Arbeit, um die RAW-Daten zu dekodieren die Bibliothek libraw 2.0, die 40 neue RAW-Formate unterstützt. Ebenfalls an Bord ist das Canon CR3-Format, das erstmals von der im März 2018 eingeführten spiegellosen Canon EOS 50 verwendet wurde. Digikam kann jetzt auch die Bildgröße des Sony Alpha 7R4 verarbeiten, die bis zu 61 Megapixel beträgt.

Listen Sie andere Formate von Leica, FujiFilm, Hasselblad, Olympus, Panasonic, GoPro und dem Drohnenhersteller DJI auf die Versionshinweise der Beta Auf. Im Allgemeinen enthält Digikam 7.0 daher Unterstützung für Rindfleisch 1100 RAW-Format.

(tiw)

Wilbert Stumpf

Organisator. Schöpfer. Evangelist der lebenslangen Popkultur. Freundlicher Zombie-Praktizierender.

Digikam 7.0: Gesichtserkennung kommt zum Hund

Umzug nach Gitlab

Gesichtserkennung: zuverlässiger mit neuronalen Netzen

Libraw 2.0: Unterstützung für neue RAW-Formate

Gemini for Business: Google plant tiefere Integration von NotebookLM und neue KI-Skills

5 Dinge über KI, die Sie heute vielleicht übersehen haben: Nachrichtenverlage werden KI-Unternehmen verklagen; Die Polizei setzt auf KI und mehr

Optimiere deine Online-Präsenz mit professioneller SEO-Beratung

Allwyn gibt erste Partnerschaft mit der prestigeträchtigen Peace Race Cycling Tour bekannt

dynaCERT gibt weltweite Verkäufe für Q4 2022 bekannt

Schreibe einen Kommentar Antwort abbrechen

presseraum.at

Umzug nach Gitlab

Gesichtserkennung: zuverlässiger mit neuronalen Netzen

Libraw 2.0: Unterstützung für neue RAW-Formate

You may also like

Gemini for Business: Google plant tiefere Integration von NotebookLM und neue KI-Skills

5 Dinge über KI, die Sie heute vielleicht übersehen haben: Nachrichtenverlage werden KI-Unternehmen verklagen; Die Polizei setzt auf KI und mehr

Optimiere deine Online-Präsenz mit professioneller SEO-Beratung

Allwyn gibt erste Partnerschaft mit der prestigeträchtigen Peace Race Cycling Tour bekannt

dynaCERT gibt weltweite Verkäufe für Q4 2022 bekannt

Schreibe einen Kommentar Antwort abbrechen