Allianz für offene Medien & Vidyo Im September 2015 war der führende Videocodec in Bezug auf die Komprimierungseffizienz HEVC (Hocheffiziente Videokodierung, oder H.265). Die Spezifikation wurde von der ITU-T im April 2013 genehmigt, und es gab bereits Implementierungen in Form von Software und Hardware. Es schien, als sei die Videobranche bereit für den Übergang von H.264/AVC auf diesen neuen Codec übertragen, so wie es viele Jahre zuvor bei MPEG-2 der Fall war.

Leider waren, motiviert durch den großen Erfolg früherer Patentlizenzprogramme im Zusammenhang mit Videocodecs, bereits zwei Patentpools aktiv und ein dritter wurde angekündigt. Jeder dieser Pools sollte als zentrale Anlaufstelle für den Erwerb von Patentrechten zur Umsetzung der Norm dienen. Schlimmer noch: Während frühere Lizenzprogramme Obergrenzen für Lizenzgebühren vorsahen (d. h. eine maximale Zahlung pro Unternehmen für die jeweilige Technologie), galt dies für einige der Pools nicht mehr. Dies führte zu ernsthaften Problemen, insbesondere für webbasierte Videoanbieter, die die Kosten pro Stream tragen mussten.

Die Reaktion der internetbasierten Videobranche war, die Dinge selbst in die Hand zu nehmen. Die Unternehmen für Videoinhalte Amazon, Netflix und YouTube/Google schlossen sich mit den Softwareentwicklern Cisco, Google, IBM, Microsoft und Mozilla sowie den Chipentwicklern ARM, Intel und NVIDIA zusammen und gründeten die Allianz für offene Medien. Das Ziel der Allianz ist es, einen quelloffenen, lizenzgebührenfreien Videocodec zu entwickeln, der HEVC übertrifft. Das Projekt wurde im September 2015 ins Leben gerufen und umfasste die laufenden Arbeiten einzelner Unternehmen an freien Videocodecs (VP9/VP10 von Google, Daala von Mozilla und Thor von Cisco). Ziel war es, nicht nur eine technische Spezifikation zu erstellen, sondern auch eine Open-Source-Software, die diese implementieren würde.

Vidyo wurde im Februar 2016 eingeladen, der Gruppe beizutreten, und ich wurde eingeladen, als Co-Vorsitzender der Real-Time Communications Subgroup (RTC SG) zu fungieren. Das Hauptaugenmerk des übergeordneten Gremiums, der Codec Working Group (Codec WG), liegt auf der Komprimierungseffizienz für die Videoübertragung (d. h. HLS- oder DASH-Streaming). Die RTC SG befasst sich mit den spezifischen Anforderungen von Echtzeitanwendungen, einschließlich Kodierung mit geringer Verzögerung, Fehlerresistenz und Unterstützung für zeitliche und räumliche Skalierbarkeit.

Die letzten 18 Monate waren eine Zeit intensiver Aktivitäten. Im August 2017 erhielten wir die Genehmigung für unseren Vorschlag für die High-Level-Syntax des Codecs, die auf den sogenannten "offenen Bitstromeinheiten" (OBUs) basiert. Die High-Level-Syntax beschreibt, wie die verschiedenen Videodatenkomponenten in "Bins" verpackt werden, damit sie von Anwendungen transparent gehandhabt werden können.

Im Dezember 2017 erhielten wir auch die Genehmigung für unseren Vorschlag zur Unterstützung der räumlichen (und zeitlichen) Skalierbarkeit in AV1, wie der Codec jetzt genannt wird. Der Entwurf imitiert die Arbeit, die wir zuvor mit Google an räumliche Skalierbarkeit im VP9-Videocodec. Die Unterstützung der räumlichen Skalierbarkeit ist für die Verwendung von AV1 in unserer hochleistungsfähigen SFU-basierten VidyoCloud unerlässlich, genau wie bei H.264/AVC und VP9. Auf diese Weise können wir alle Innovationen nutzen, die in unser System eingeflossen sind, und von der verbesserten Kodiereffizienz von AV1 profitieren.

Auch wenn es noch einige Zeit dauern wird, bis kommerzielle Implementierungen, die die Fähigkeiten von AV1 voll ausschöpfen, auf dem Markt verfügbar sind, gehen wir davon aus, dass AV1 in 12 bis 18 Monaten ein bedeutender Konkurrent sein wird. Die Tatsache, dass Apple und Facebook der Allianz in den letzten Monaten beigetreten sind, ist ein weiteres Indiz dafür, dass der Wind in den Segeln von AV1 weht. Chips, die AV1 unterstützen, dürften Ende 2019, wenn nicht früher, auf den Markt kommen. Ein Teil der Herausforderung bei der Implementierung eines neuen Codecs liegt in den Optimierungen, die im Encoder-Teil verwendet werden, insbesondere wenn Echtzeitleistung erforderlich ist.

Es ist das erste Mal in der Geschichte der Videocodecs, dass eine so große Industrieallianz hinter einem Industrieforum steht, das mit den offiziellen Standards der in Genf ansässigen internationalen Normungsorganisationen konkurriert. Dies ist wirklich der Beginn einer neuen Ära.

Die Situation wird in einem Blogbeitrag sehr anschaulich beschrieben, "Eine Krise, die Ursachen und eine Lösungvon Leonardo Chiariglione, dem Vorsitzenden (formell "Convenor") von MPEG (Motion Pictures Experts Group), einer der beiden Ausschüsse, die diese Standards entwickeln, und Teil der in Genf ansässigen Internationale Organisation für Normung. Dr. Chiariglione argumentiert:

"AOM wird dem Videocodec-Markt sicherlich die dringend benötigte Stabilität verleihen, aber dies wird auf Kosten eines geringeren, wenn nicht gar gänzlich gestoppten technischen Fortschritts gehen.

Man geht davon aus, dass das Fehlen von Patentgebühren dazu führt, dass Unternehmen und akademische Einrichtungen/Forschungsinstitute nicht mehr in neue Videocodec-Technologien investieren und sich der Fortschritt somit verlangsamt oder sogar zum Stillstand kommt.

Ich kann das Argument durchaus nachvollziehen. Beachten Sie, dass mehrere der Innovationen, die die Grundlage von H.264/AVC bilden, von akademischen und Forschungseinrichtungen stammen, die keine Produkte herstellen. Eine Rendite auf ihre Investitionen kann nur durch Patentgebühren erzielt werden.

Dieser beunruhigenden Situation steht jedoch die Tatsache gegenüber, dass zum ersten Mal alle Browserhersteller - Apple, Google, Microsoft und Mozilla - Teil der gleichen Video-Codec-Entwicklungsorganisation sind. Auch wenn es noch keine konkrete Ankündigung gibt, ist es wahrscheinlich, dass wir endlich Unterstützung für denselben High-End-Codec in allen wichtigen Browsern haben werden, was ein großer Meilenstein für WebRTC wäre. Wenn die Implementierungen nicht nur auf Streaming-Decoder beschränkt sind, haben wir vielleicht endlich den heiligen Gral der Interoperabilität für Echtzeitanwendungen.

Vidyo verfügt über eine Systemarchitektur, die nahtlose, native WebRTC-Videounterstützung in der gesamten VidyoCloud-Infrastruktur bietet. Die Möglichkeit, einen einzigen Codec über alle Systeme hinweg zu verwenden, von Telefonen und Tablets bis hin zu Desktops und Raumsystemen, würde unseren Kunden enorme Leistungs- und Qualitätsvorteile bieten, insbesondere im Gesundheitswesen und bei Finanzdienstleistungen, wo browserbasierte Anwendungen stark genutzt werden. Wenn das Potenzial von AV1 für universelle Interoperabilität ausgeschöpft wird, wird dies sicherlich den Beginn einer neuen Ära in der Videokommunikationsbranche markieren.

Zum Inhalt springen