Konzepte der Profilerstellung

Die Profilerstellung ist eine Form der dynamischen Codeanalyse. Sie erfassen Merkmale der Anwendung während der Ausführung und verwenden diese Informationen, um zu ermitteln, wie Sie diese schneller und effizienter machen können.

In der Vergangenheit wurde die Profilerstellung nur während der Anwendungsentwicklung durchgeführt. Dieser Ansatz basierte auf der Fähigkeit, Lasttests und Benchmarks zu entwickeln, anhand derer eine Produktionsumgebung genau vorhergesagt werden konnte.

Die kontinuierliche Profilerstellung hingegen bezieht sich auf die Profilerstellung einer Anwendung, während sie in einer Produktionsumgebung ausgeführt wird. Bei diesem Ansatz müssen keine genauen Lasttests und Benchmarks zu Prognosezwecken für die Produktionsumgebung entwickelt werden. Studien zur kontinuierlichen Profilerstellung haben gezeigt, dass sie präzise Ergebnisse liefert und kostengünstig ist.*

Cloud Profiler ist ein Tool für die kontinuierliche Profilerstellung für Anwendungen, die in Google Cloud ausgeführt werden:

  • Dabei handelt es sich um einen statistischen bzw. Sampling-Profiler mit sehr geringem Overhead, der sich für Produktionsumgebungen eignet.

  • Cloud Profiler unterstützt gängige Sprachen und erfasst mehrere Profiltypen. Einer Übersicht finden Sie unter Verfügbare Arten der Profilerstellung.

Das Konfigurieren einer Google Cloud-Anwendung zum Generieren von Profildaten ist ein einfacher, einmaliger Prozess: Sie müssen Ihren Dienst lediglich mit einem enthaltenen Profiler-Agent verknüpfen oder mit diesem ausführen. Nach dem Bereitstellen der Anwendung wird der Profiler-Agent regelmäßig ausgeführt, um Leistungsdaten zu erfassen und diese dann an Ihr Google Cloud-Projekt zu senden. Weitere Informationen zu diesem Vorgang finden Sie unter Profilerfassung.

Nachdem Sie Profildaten für Ihre Anwendung erfasst haben, können Sie die Daten mithilfe der Profiler-Oberfläche analysieren. Das Analysieren von Profildaten ist in der Regel ein iterativer Prozess, der auf Ihrer Kenntnis des Anwendungsdesigns und deren Programmiersprache basiert.

*Weitere Informationen finden Sie unter Google-Wide Profiling: A Continuous Profiling Infrastructure for Data Centers und Continuous Profiling: Where Have All the Cycles Gone?.

Verfügbare Arten der Profilerstellung

In der folgenden Tabelle sind die unterstützten Profiltypen zusammengefasst:

Profiltyp Go Java Node.js Python
CPU-Zeit JaJ Ja
Heap JaJ Ja
Zugewiesener Heap Ja
Konflikt Ja
Threads Ja
Echtzeit Ja JJa

Im weiteren Verlauf dieses Abschnitts geben wir Ihnen ausführlichere Informationen zu jedem dieser Profiltypen.

Zeitmessungen

  • Die CPU-Zeit ist die Zeit, welche die CPU für die Ausführung eines Codeblocks aufwendet.

    Die CPU-Zeit für eine Funktion gibt an, wie lange die Ausführung von Anweisungen gedauert hat. Dies schließt die Zeit aus, welche die CPU gewartet oder zum Verarbeiten von Anweisungen für andere Vorgänge aufgewendet hat.

  • Echtzeit (auch tatsächliche Zeit) ist die Zeit, die für die gesamte Ausführung eines Codeblocks benötigt wird.

    Die Echtzeit für eine Funktion misst die Zeit, die zwischen dem Beginn und Ende einer Funktion verstrichen ist. Die Echtzeit umfasst die gesamte Wartezeit, auch die Zeit für das Warten auf Sperren und die Threadsynchronisierung. Somit kann die Echtzeit für einen Codeblock niemals unter der CPU-Zeit liegen.

Sollte die Echtzeit länger als die CPU-Zeit sein, so bedeutet dies, dass der Code lange auf andere Vorgänge wartet. Wenn der Unterschied wesentlich ist, kann die Anwendung einen Ressourcenengpass darstellen.

Wenn die CPU-Zeit nahe an der Echtzeit liegt, ist der Code CPU-intensiv. Die für die Ausführung benötigte Zeit wird fast vollständig von der CPU beansprucht. Für diese lang andauernden, CPU-intensiven Codeblöcke kommt eventuell eine Optimierung infrage.

Heap-Speichernutzung

  • Die Heap-Nutzung (auch Heap genannt) ist die Arbeitsspeichermenge, die im Heap des Programms zugewiesen wird, in dem Moment, wenn das Profil erfasst wird. Im Gegensatz zu anderen Profiltypen, für die Daten für ein Intervall erfasst werden, erfasst dieser Profiltyp die Heap-Nutzung zu einem einzigen Zeitpunkt.

  • Die Heap-Zuweisung (auch zugewiesener Heap) ist der gesamte Arbeitsspeicher, der im Heap des Programms zugewiesen wurde, während das Profil erfasst wurde. Dieser Wert umfasst jeglichen zugewiesenen Speicher, der freigegeben wurde und nicht mehr verwendet wird. Nehmen wir als Beispiel einen Job, der die folgende Sequenz wiederholt: weist 1 MiB zu, wartet 500 ms, gibt 1 MiB frei und wartet 500 ms. In den 10 Sekunden, in denen das zugewiesene Heap-Profil erfasst wird, erfolgen 10 Zuweisungen und 10 Freigaben. In diesem Profil würde 10 MiB zugewiesener Heap angezeigt, da die Freigaben nicht berücksichtigt werden. Die durchschnittliche Zuweisungsrate beträgt 10 MiB/10 Sekunden oder 1 MiB pro Sekunde.

Mit Heap-Nutzungsprofilen können Sie potenzielle Ineffizienzen und Arbeitsspeicherlecks in Ihren Programmen finden. Heap-Zuweisungsprofile zeigen dagegen auf, welche Zuweisungen den größten Aufwand für den Garbage Collector darstellen.

Informationen zum Threading

Anwendungen, die Threads erstellen, können verschiedentlich beeinträchtigt werden, zum Beispiel durch blockierte Threads oder durch Sicherheitslücken:

  • Blockierte Threads sind Threads, die erstellt werden, aber auf eine Sperre warten. Diese Threads werden aktuell nicht ausgeführt und werden möglicherweise nie ausgeführt. Ein blockierter Thread kann jedoch ausgeführt werden.
  • Threadlecks treten auf, wenn die Anzahl der erstellten Threads kontinuierlich steigt.

Blockierte Threads sind eine Ursache für Threadlecks.

Auf Frameebene wird im Profil Thread die durchschnittliche Anzahl der Threads angezeigt, die diesen Frame enthalten. Dieser Profiltyp erfasst die Thread-Nutzung zu einem einzigen Zeitpunkt.

Konflikt

In Programmen mit mehreren Threads kann es zu erheblichen Wartezeiten kommen, bis der Zugriff auf eine gemeinsam genutzte Ressource serialisiert ist. Ein gutes Verständnis des Konfliktverhaltens kann beim Codedesign eine Orientierungshilfe sein und Informationen zur Leistungsoptimierung liefern.

Profilerfassung

Die Rolle des Profiler-Agents besteht darin, Profildaten aus Ihrer Anwendung zu erfassen und über die Profiler API an das Profiler-Back-End zu übertragen. Für jede einzelne Instanz einer Anwendung wird ein eigenes Profil erstellt, das vier Felder enthält, mit denen die Bereitstellung der Anwendung eindeutig identifizierbar ist:

  • Google Cloud-Projekt
  • Name der Anwendung
  • Anwendungszone
  • Anwendungsversion

Wenn ein Agent bereit ist, ein Profil zu erfassen, gibt er einen Profiler API-Befehl an das Profiler-Back-End aus. Das Back-End erhält diese Anfrage und antwortet im einfachsten Fall sofort dem Agent. Die Antwort gibt den zu erfassenden Profiltyp an. Als Antwort erfasst der Agent das Profil und überträgt es an das Back-End. Schließlich verknüpft das Profiler-Backend das Profil mit Ihrem Google Cloud-Projekt. Sie können es dann über die Benutzeroberfläche des Profilers ansehen und analysieren.

Die tatsächliche Handshake-Sequenz ist komplexer als im vorherigen Abschnitt beschrieben. Wenn der Profiler beispielsweise eine Anfrage von einem Agent empfängt, prüft das Backend seine Datenbank, um festzustellen, ob es vorherige Anfragen vom Agent empfangen hat. Wenn keine Anfragen vorhanden sind, werden die Agent-Informationen zur Backend-Datenbank hinzugefügt. Eine neue Bereitstellung wird erstellt, wenn die Agent-Bereitstellungsfelder nicht mit denen eines anderen aufgezeichneten Agents übereinstimmen.

Das Backend wählt für jede Bereitstellung und jeden Profiltyp durchschnittlich einmal pro Minute einen Agent aus und weist diesen an, ein Profil zu erfassen. Wenn die Agents für eine Bereitstellung beispielsweise die Erstellung von Heap- und Echtzeitprofilen unterstützen, werden durchschnittlich zwei Profile pro Minute erfasst:

  • Für alle Profiltypen mit Ausnahme von Heap-Nutzung und Threads stellt ein einzelnes Profil Daten dar, die 10 Sekunden lang erfasst wurden.

  • Die Heap-Nutzung und die Thread-Profile werden sofort erfasst.

Nachdem der Agent das Profiler-Backend benachrichtigt hat, dass Daten erfasst werden können, ist der Agent inaktiv, bis das Backend mit dem zu erfassenden Profiltyp antwortet. Wenn zehn Instanzen eines Dienstes in derselben Bereitstellung ausgeführt werden, erstellen Sie zehn Profiler-Agents. In den meisten Fällen sind diese Agents jedoch inaktiv. In einem Zeitraum von zehn Minuten werden zehn Profile erfasst. Jeder Agent erhält durchschnittlich eine Antwort pro Profiltyp. Es liegt eine gewisse Randomisierung vor, sodass die tatsächliche Anzahl variieren kann.

Das Profiler-Back-End verwendet Profiler API-Kontingente und die Felder für die Profilbereitstellung, um die aufgenommenen Profile zu begrenzen. Weitere Informationen zum Aufrufen und Verwalten Ihrer Profiler-Kontingente finden Sie unter Kontingente und Limits.

Daten analysieren

Nachdem Profiler Daten erfasst hat, können Sie diese mit der Profiler-Oberfläche ansehen und analysieren.

Rufen Sie in der Google Cloud Console die Seite Profiler auf:

Gehen Sie zum Profiler.

Sie können diese Seite auch über die Suchleiste finden.