Der 6. April 2022 steht ganz im Zeichen der Neuauflage des Data Cloud Summit, einer jährlich von Google Cloud organisierten Präsentation. Mehrere Konferenzen werden organisiert, um einige der neuen Funktionen anzukündigen, die von Mountain Views Cloud-Computing-Unternehmen entwickelt wurden, oder um spezifische Themen rund um das Datenmanagement zu diskutieren.
Aktualisierungen, Vorschauversionen mehrerer APIs, Lösungskits, Partnerschaften und Zusammenarbeit: Kommentare zu neuen Funktionen, die von Google Cloud im Rahmen dieser Veranstaltung eingeführt wurden.
Meta macht sein massives Sprachverarbeitungsmodell Open Source
Mit BigLake will Google Cloud Data Lakes und Data Stores vereinen
Die erste von Google Cloud angekündigte Neuheit ist die bevorstehende Ankunft von großer See. Dieses Tool soll es Unternehmen ermöglichen, ihre Data Lakes besser zu verwalten. Es ist eine Speichermethode, mit der große Datenmengen gespeichert oder verarbeitet werden können.
Generell stehen Data Lakes im Gegensatz zu Data Warehouses, die als eher traditionell gelten und auch heute noch von vielen Strukturen genutzt werden. Während ein Datenspeicher nur strukturierte Daten (vordefiniert und nach einer genauen Struktur formatiert) enthalten kann, damit sie so schnell wie möglich verarbeitet werden können, ist dies bei Data Lakes nicht der Fall, wo die Daten in einer rohen Form gespeichert werden können dann zugeschnitten auf die Wünsche und Bedürfnisse des Benutzers, genannt Diese Tabelle beim Lesen.
Durch (schwache) Verwaltung und Datenspeicherung in einem Data Lake können jedoch Silos entstehen: Sätze von Rohdaten, auf die nur ein Teil des Unternehmens zugreifen kann (eine Geschäftseinheit, ein Geschäftsbereich usw.), auf die der Rest des Unternehmens keinen Zugriff hat Zugriff.
Ihre Anhäufung kann für ein Unternehmen zu einem echten Hindernis werden, da viele Entitäten ähnliche Daten im selben Data Lake speichern können und somit zwei identische Silos entstehen, die Platz in der Speicherumgebung beanspruchen, was insbesondere zu Speicherkosten führt. Es ist auch ein Hindernis für die Organisation des Unternehmens, dass jede Einheit zuerst feststellen muss, dass sie keinen Zugriff auf bestimmte Daten hat, die im Data Lake enthalten sind, und dann einen Prozess initiieren muss, der ihr den Zugriff darauf ermöglicht. Und verwenden Sie es, was eine echte Zeitverschwendung ist.
Mit BigLake bietet Google Cloud eine API, die es Unternehmen ermöglicht, ihre Data Lakes und Datenspeicher zu standardisieren, um ihre Daten besser zu analysieren und zu verwalten, ohne sich Gedanken über das Format (roh oder strukturiert) oder die verwendete Speichermethode machen zu müssen. Diese Lösung wird in BigQuery, die führende SaaS-Software von Google Cloud, integriert.

Wie Sudhir Hasbe, Director of Production Management bei Google Cloud, betont: „BigLake ermöglicht die Standardisierung von Daten unabhängig vom ursprünglich verwendeten Speicherformat.“ Bild: Google Cloud.
Spanner wurde mit der Hinzufügung der Spanner-Streams-Änderungsfunktion aktualisiert
Neben BigLake ist auch Google Cloud enthalten Spanners Änderungsstreams. Dieses neue Update sollte auch den Datenverwaltungsbeschränkungen für Benutzer von Spanner, einem der Datenspeicher- und Verwaltungsdienste von Google, ein Ende bereiten.
Unternehmen können nun Änderungen in ihren Datenbanken in Echtzeit überwachen, um sich schneller an diese Änderungen anzupassen. Sie können die in Spanner vorgenommenen Änderungen an BigQuery iterieren, um in Echtzeit auf die Analysen zuzugreifen oder zu sehen, welche Änderungen im Falle einer Änderung vorgenommen werden können.
Vertex AI Workbench Update: Cloud Computing zur Unterstützung der Entwicklung von Modellen für maschinelles Lernen
Während der Google Cloud Next 2021 gab Mountain View bekannt, dass es aktualisiert wird Vertex AI-Schreibtisch in den kommenden Monaten. Dies ist jetzt der Fall. Die Lösungssuite ist für das Erstellen, Trainieren und Bereitstellen von Modellen für maschinelles Lernen optimiert, um besser mit BigQuery, Serverless Spark und Dataproc zusammenzuarbeiten.
Laut Google Cloud wird Vertex AI es KI-Experten ermöglichen, Modelle für maschinelles Lernen zu entwerfen. Fünfmal schneller als herkömmliche Laptops Sie werden in der Lage sein, ihre Modelle regelmäßig mit in der Cloud gespeicherten Daten zu aktualisieren.
Dank der Ergänzung werden neue Funktionen eingeführt Vertex AI-Modellregistrierung. Dieses Tool bietet ein Repository zum Hinzufügen, Entdecken, Verwenden und Manipulieren von Modellen für maschinelles Lernen, insbesondere damit Entwickler von KI-Modellen ihre Modelle einfacher mit Anwendungsentwicklern teilen können, die diese Algorithmen nutzen möchten.

So sieht die Vertex AI Model Registry aus. Es wird als eine Bibliothek von Modellen für maschinelles Lernen präsentiert, die mit nur wenigen Klicks hinzugefügt, entfernt, geändert oder geteilt werden können. Bild: Google Cloud.
Verbundene Tabellenkalkulationen für Looker: Verwendung von Daten zur Verbesserung der Entscheidungsfindung
Looker ist eine Business-Intelligence- und Business-Intelligence-Plattform, die es Benutzern ermöglicht, Daten zu verwenden, um die Produktivität zu verbessern oder Innovationen in das Unternehmen zu bringen, indem sie effektive Entscheidungen treffen.
Google Cloud kündigte die Einführung von Connected Sheets an, einem Tool, das den Zugriff auf Looker-Datenmodelle in Data Studio (eine Lösung, mit der informative Dashboards und Berichte mit Daten erstellt werden können) oder in Google Sheets (Google Sheet) ermöglicht. Das Ziel laut Google Cloud ist es sicherzustellen, dass „ Looker-Benutzer können leicht auf datengesteuerte Erkenntnisse zugreifen, um Innovationen voranzutreiben und datengesteuerte Entscheidungen zu treffen, indem sie alle dafür erforderlichen Tools vereinheitlichen “.

Mit verbundenen Tabellenkalkulationen wird es möglich sein, auf alle Funktionen von Looker direkt aus der Google Tabellen-Tabellenkalkulation zuzugreifen. Somit ermöglicht Connected Sheets die Vereinheitlichung der Verwendung von Looker und der Tabellenkalkulation für eine bessere Datenvisualisierung. Bild: Google Cloud.
The Data Cloud Alliance: Eine Arbeitsgruppe, die das Datenmanagement für alle einfacher macht
Für Gerrit Kazmayr, Vice President of Data Analytics and Databases bei Google Cloud, sind „Daten die gemeinsame Grundlage für alle digitalen Transformationen.“ Gemeinsam mit mehreren Cloud-Dienstleistern und Datenhostern steht Google Cloud hinter der Data Cloud Alliance-Initiative. Dazu gehören Confluent, Databriks, die letztes Jahr Investitionen in Low/No-Code angekündigt haben, Dataiku, Deloitte, Elastic, Fivetran, MongoDB, Neo4j, Redis und Starbust.
Das Hauptziel dieser Gruppe wird es sein, moderne Herausforderungen im Zusammenhang mit der digitalen Transformation gemeinsam zu lösen, indem sie sich dafür einsetzen, das Datenmanagement zu vereinfachen, indem sie verschiedene und vielfältige Plattformen, Systeme und Technologien (kundenspezifische Infrastruktur, Erstellung von APIs und Unterstützung der Datenintegration) verwenden. Alle Mitglieder dieser Allianz werden zusammenarbeiten, um die mit Data Governance verbundene Komplexität zu reduzieren.
Mit der bevorstehenden Einführung all dieser neuen Funktionen zeigt Google Cloud seine Ambitionen, indem es verschiedene und effektivere Lösungen und Updates anbietet, die es ermöglichen, das tägliche Leben von Unternehmen durch die Nutzung von Daten und Cloud Computing zu verbessern.
In den letzten Jahren haben sich mehrere Strukturen mit Google Cloud zusammengeschlossen, um der Cloud und Daten bei der Transformation ihres Geschäfts eine wichtigere Rolle zu geben. Dies war bei Renault der Fall, um seine Lieferkette, Twitter, YouTube oder Lydia zu digitalisieren. Kürzlich lud Japan den Cloud-Zweig von Google ein, um eine einzige Plattform zu schaffen, die alle Regierungsdienste zusammenführt.