Tetap teratur dengan koleksi
Simpan dan kategorikan konten berdasarkan preferensi Anda.
Halaman ini menjelaskan cara akun layanan digunakan di Cloud Data Fusion. Untuk
mengetahui informasi selengkapnya, lihat Menggunakan akun layanan.
Project tenant dan pelanggan
Cloud Data Fusion menyiapkan akun layanan untuk mengakses resource di project berikut:
Project tenant
Cloud Data Fusion membuat project tenant untuk menyimpan resource dan layanan yang diperlukan untuk mengelola pipeline atas nama Anda. Misalnya: menjalankan
pipeline di cluster Dataproc yang berada di project
pelanggan Anda. Project tenant tidak ditampilkan kepada Anda, tetapi saat membuat instance pribadi, Anda mungkin perlu menggunakan nama project tenant untuk menyiapkan peering VPC.
Untuk mengetahui informasi selengkapnya, lihat dokumentasi Infrastruktur Layanan tentang
project tenant.
Project pelanggan
Anda membuat dan memiliki project ini. Secara default, Cloud Data Fusion membuat
cluster Dataproc sementara di project ini untuk menjalankan
pipeline Anda.
Diagram berikut menunjukkan instance Cloud Data Fusion yang berjalan di
project tenant dan pipeline yang berjalan di cluster Dataproc di
project pelanggan.
Akun layanan di Cloud Data Fusion
Akun layanan memberikan identitas untuk Cloud Data Fusion, yang memberi Cloud Data Fusion akses ke resource Anda.
Saat Anda mengaktifkan Cloud Data Fusion API dan membuat
instance Cloud Data Fusion, akun layanan akan ditambahkan ke project Anda untuk
mengakses resource seperti Service Networking,
Dataproc, Cloud Storage, BigQuery, Spanner,
dan Bigtable. Akun layanan ini disebut
Agen Layanan Cloud Data Fusion API.
Peran diberikan secara otomatis kepada agen layanan ini.
Akun layanan diidentifikasi oleh alamat emailnya, yang bersifat unik untuk
akun tersebut.
Jenis akun layanan berikut digunakan di Cloud Data Fusion. Untuk
mengetahui informasi selengkapnya, lihat Jenis akun layanan.
Agen layanan, yang disebut
Agen Layanan Cloud Data Fusion API, yang
dibuat Cloud Data Fusion untuk mendapatkan akses ke resource pelanggan sehingga
dapat bertindak atas nama pelanggan. Akun ini digunakan di project tenant untuk mengakses resource project pelanggan. Misalnya,
Pratinjau berjalan di memori, bukan di cluster Dataproc.
Peran Identity and Access Management
Cloud Data Fusion API Service Agent
(roles/datafusion.serviceAgent) yang ditetapkan ke Akun Layanan Cloud Data Fusion secara default, mencakup izin tambahan untuk memastikan pengalaman pengguna yang optimal. Untuk meningkatkan keamanan, Anda
dapat membuat peran kustom dengan kumpulan
izin minimum
yang diperlukan untuk tugas, dan menetapkannya ke Akun Layanan Cloud Data Fusion.
Akun layanan Compute Engine default yang
dibuat Cloud Data Fusion untuk men-deploy tugas yang mengakses resource
Google Cloud lainnya. Secara default, VM ini dilampirkan ke VM cluster Dataproc untuk memungkinkan Cloud Data Fusion mengakses resource Dataproc selama pipeline berjalan. Di edisi Enterprise Cloud Data Fusion, Anda dapat menjalankan pipeline dari akun layanan yang dikelola pengguna dengan membuat profil dari tab Konsol Cloud Data Fusion→Admin Sistem→Konfigurasi dan menambahkan akun layanan kustom. Pada versi 6.2.3 dan yang lebih baru, Anda dapat memilih akun layanan kustom untuk dilampirkan ke cluster Dataproc saat membuat instance Cloud Data Fusion. Untuk mengetahui informasi selengkapnya, lihat
Akun layanan di Dataproc.
[[["Mudah dipahami","easyToUnderstand","thumb-up"],["Memecahkan masalah saya","solvedMyProblem","thumb-up"],["Lainnya","otherUp","thumb-up"]],[["Sulit dipahami","hardToUnderstand","thumb-down"],["Informasi atau kode contoh salah","incorrectInformationOrSampleCode","thumb-down"],["Informasi/contoh yang saya butuhkan tidak ada","missingTheInformationSamplesINeed","thumb-down"],["Masalah terjemahan","translationIssue","thumb-down"],["Lainnya","otherDown","thumb-down"]],["Terakhir diperbarui pada 2025-08-12 UTC."],[[["\u003cp\u003eCloud Data Fusion uses service accounts to access resources in both tenant and customer projects, enabling it to manage pipelines on the user's behalf.\u003c/p\u003e\n"],["\u003cp\u003eThe Cloud Data Fusion API Service Agent is a service account created automatically when enabling the Cloud Data Fusion API, granting it access to resources like Service Networking, Dataproc, Cloud Storage, and others.\u003c/p\u003e\n"],["\u003cp\u003eA default Compute Engine service account is also created to deploy jobs that access other Google Cloud resources, which can attach to a Dataproc cluster VM to enable Cloud Data Fusion to access Dataproc resources during pipeline runs.\u003c/p\u003e\n"],["\u003cp\u003eIn Cloud Data Fusion Enterprise edition, pipelines can run from a user-managed service account by creating a profile in the Cloud Data Fusion console, enhancing control and customization.\u003c/p\u003e\n"],["\u003cp\u003eCustomer project is owned by the customer and is the location where the ephemeral Dataproc cluster is located in order to run the user's pipelines.\u003c/p\u003e\n"]]],[],null,["# Service accounts in Cloud Data Fusion\n\nThis page describes how service accounts are used in Cloud Data Fusion. For\nmore information, see [Use service accounts](/iam/docs/service-accounts).\n\n### Tenant and customer projects\n\nCloud Data Fusion sets up service accounts to access resources in the\nfollowing projects:\n\nTenant project\n\n: Cloud Data Fusion creates a tenant project to hold the resources and\n services it needs to manage pipelines on your behalf. For example: running\n pipelines on your Dataproc clusters that reside in your customer\n project. A tenant project is not exposed to you, but when you create a\n private instance, you might need to use the tenant project name to set up VPC\n peering.\n\n For more information, see the Service Infrastructure documentation about\n [tenant projects](/service-infrastructure/docs/glossary#tenant).\n\nCustomer project\n\n: You create and own this project. By default, Cloud Data Fusion creates an\n ephemeral Dataproc cluster in this project to run the your\n pipelines.\n\nThe following diagram shows a Cloud Data Fusion instance running in a\ntenant project and a pipeline running on a Dataproc cluster in a\ncustomer project.\n\nService accounts in Cloud Data Fusion\n-------------------------------------\n\nA service account provides an identity for Cloud Data Fusion, which gives\nCloud Data Fusion access to your resources.\n\nWhen you enable the Cloud Data Fusion API and create a\nCloud Data Fusion instance, a service account is added to your project to\naccess resources like Service Networking,\nDataproc, Cloud Storage, BigQuery, Spanner,\nand Bigtable. This service account is called the\n[Cloud Data Fusion API Service Agent](/iam/docs/understanding-roles#datafusion.serviceAgent).\nRoles are automatically granted to this service agent.\n\nA service account is identified by its email address, which is unique to the\naccount.\n\nThe following types of service accounts are used in Cloud Data Fusion. For\nmore information, see [Types of service accounts](/iam/docs/service-account-types).\n\nWhat's next\n-----------\n\n- Learn about [controlling access to data](/data-fusion/docs/access-control).\n- [Give Service Account User permissions](/data-fusion/docs/how-to/granting-service-account-permission).\n- See Cloud Data Fusion [pricing](/data-fusion/pricing)."]]