Cette page a été traduite par l'API Cloud Translation.

Présentation des transactions

Cette page décrit les transactions dans Spanner et présente les interfaces de transaction en lecture-écriture, en lecture seule et en LMD partitionné de Spanner.

Dans Spanner, une transaction est un ensemble de lectures et d'écritures. Toutes les opérations d'une transaction sont atomiques, ce qui signifie qu'elles réussissent toutes ou échouent toutes.

Elles servent à effectuer des transactions dans une base de données Spanner. Une session représente un canal de communication logique avec le service de base de données Spanner. Les sessions peuvent exécuter une ou plusieurs transactions à la fois. Pour en savoir plus, consultez Sessions.

Types de transactions

Spanner accepte les types de transactions suivants, chacun étant conçu pour des modèles d'interaction de données spécifiques :

Lecture/écriture : ces transactions utilisent un verrouillage pessimiste et, si nécessaire, un commit en deux phases. Elles peuvent échouer et nécessiter des nouvelles tentatives. Bien qu'ils soient limités à une seule base de données, ils peuvent modifier les données de plusieurs tables au sein de cette base de données.
Lecture seule : ces transactions garantissent la cohérence des données pour plusieurs opérations de lecture, mais n'autorisent pas les modifications de données. Elles s'exécutent à un horodatage déterminé par le système pour assurer la cohérence, ou à un horodatage passé configuré par l'utilisateur. Contrairement aux transactions en lecture-écriture, elles ne nécessitent pas d'opération de commit ni de verrouillage, bien qu'elles puissent s'interrompre pour attendre la fin des opérations d'écriture en cours.
LMD partitionné : ce type de transaction exécute les instructions LMD en tant qu'opérations LMD partitionné. Il est optimisé pour les mises à jour et les suppressions de données à grande échelle, comme le nettoyage des données ou l'insertion de données groupées. Pour de nombreuses écritures qui n'ont pas besoin d'une transaction atomique, envisagez d'utiliser des écritures par lot. Pour en savoir plus, consultez Modifier des données à l'aide d'écritures par lot.

Transactions en lecture-écriture

En utilisant le niveau d'isolation sérialisable par défaut, les transactions en lecture/écriture lisent, modifient et écrivent des données de manière atomique n'importe où dans une base de données. Ce type de transaction est cohérent en externe.

Lorsque vous utilisez des transactions en lecture/écriture, nous vous recommandons de minimiser la durée d'activité d'une transaction. Des durées de transaction plus courtes augmentent la probabilité d'un commit réussi et réduisent les conflits. Spanner tente de maintenir les verrous de lecture actifs tant que la transaction continue d'effectuer des lectures et qu'elle n'a pas été arrêtée par des opérations sessions.commit ou sessions.rollback. Si le client reste inactif pendant de longues périodes, Spanner peut libérer les verrous de la transaction et l'annuler.

Conceptuellement, une transaction en lecture-écriture se compose de zéro ou plusieurs lectures ou instructions SQL suivies de sessions.commit. À tout moment avant sessions.commit, le client peut envoyer une requête sessions.rollback pour annuler la transaction.

Pour effectuer une opération d'écriture qui dépend d'une ou de plusieurs opérations de lecture, utilisez le niveau d'isolation sérialisable par défaut et verrouillez la transaction en lecture-écriture :

Si vous devez valider une ou plusieurs opérations d'écriture de manière atomique, effectuez ces écritures dans la même transaction en lecture-écriture. Par exemple, si vous transférez 200 $ du compte A au compte B, effectuez les deux opérations d'écriture (diminuer le compte A de 200 $et augmenter le compte B de 200 $) et les lectures des soldes de compte initiaux dans la même transaction.
Si vous souhaitez doubler le solde du compte A, effectuez les opérations de lecture et d'écriture dans la même transaction. Cela garantit que le système lit le solde avant de le doubler, puis de le mettre à jour.
Si vous pouvez effectuer une ou plusieurs opérations d'écriture qui dépendent des résultats d'une ou de plusieurs opérations de lecture, effectuez ces écritures et ces lectures dans la même transaction en lecture-écriture, même si les opérations d'écriture ne sont pas exécutées. Par exemple, si vous souhaitez transférer 200 $du compte A au compte B uniquement si le solde actuel de A est supérieur à 500 $, incluez la lecture du solde de A et les opérations d'écriture conditionnelles dans la même transaction, même si le transfert n'a pas lieu.

Pour effectuer des opérations de lecture, utilisez une méthode de lecture unique ou une transaction en lecture seule :

Si vous n'effectuez que des opérations de lecture et que vous pouvez les exprimer à l'aide d'une méthode de lecture unique, utilisez cette méthode ou une transaction en lecture seule. Contrairement aux transactions en lecture-écriture, les lectures uniques n'acquièrent pas de verrous.

Interface

Les bibliothèques clientes Spanner fournissent une interface pour l'exécution d'un ensemble de tâches dans une transaction en lecture/écriture, avec la possibilité de nouvelles tentatives d'exécution en cas d'échec de la transaction. Une transaction Spanner peut nécessiter plusieurs tentatives avant d'être validée.

Plusieurs situations peuvent entraîner l'abandon de transactions. Par exemple, dans le cas d'un isolement sérialisable, un blocage peut se produire si deux transactions tentent de modifier des données simultanément. Dans ce cas, Spanner abandonne une transaction pour permettre à l'autre de se poursuivre. Plus rarement, des événements transitoires dans Spanner peuvent également entraîner l'annulation de transactions.

Toutes les transactions en lecture-écriture fournissent les propriétés ACID des bases de données relationnelles. Comme les transactions sont atomiques, une transaction annulée n'a aucun effet sur la base de données. Réessayez la transaction au cours de la même session pour améliorer le taux de réussite. Chaque nouvelle tentative qui génère une erreur ABORTED augmente la priorité de verrouillage de la transaction. De plus, les pilotes clients Spanner incluent une logique interne de nouvelles tentatives de transaction qui masque les erreurs temporaires en réexécutant la transaction.

Lorsque vous utilisez une transaction dans une bibliothèque cliente Spanner, vous définissez le corps de la transaction en tant qu'objet fonction. Cette fonction encapsule les lectures et les écritures effectuées sur une ou plusieurs tables de base de données. La bibliothèque cliente Spanner exécute cette fonction à plusieurs reprises jusqu'à ce que la transaction soit validée ou qu'elle rencontre une erreur pour laquelle les nouvelles tentatives ne sont pas possibles.

Exemple

Supposons que vous disposiez d'une colonne MarketingBudget dans la table Albums :

CREATE TABLE Albums (
  SingerId        INT64 NOT NULL,
  AlbumId         INT64 NOT NULL,
  AlbumTitle      STRING(MAX),
  MarketingBudget INT64
) PRIMARY KEY (SingerId, AlbumId);

Votre service marketing vous demande de transférer 200 000 $du budget de Albums (2, 2) vers Albums (1, 1), mais uniquement si la somme est disponible dans le budget de cet album. Vous devez utiliser le verrouillage des transactions en lecture-écriture pour cette opération, car la transaction peut effectuer des écritures en fonction du résultat de la lecture.

L'exemple suivant montre comment exécuter une transaction en lecture-écriture dans le niveau d'isolation sérialisable par défaut de Spanner :

C++

void ReadWriteTransaction(google::cloud::spanner::Client client) {
  namespace spanner = ::google::cloud::spanner;
  using ::google::cloud::StatusOr;

  // A helper to read a single album MarketingBudget.
  auto get_current_budget =
      [](spanner::Client client, spanner::Transaction txn,
         std::int64_t singer_id,
         std::int64_t album_id) -> StatusOr<std::int64_t> {
    auto key = spanner::KeySet().AddKey(spanner::MakeKey(singer_id, album_id));
    auto rows = client.Read(std::move(txn), "Albums", std::move(key),
                            {"MarketingBudget"});
    using RowType = std::tuple<std::int64_t>;
    auto row = spanner::GetSingularRow(spanner::StreamOf<RowType>(rows));
    if (!row) return std::move(row).status();
    return std::get<0>(*std::move(row));
  };

  auto commit = client.Commit(
      [&client, &get_current_budget](
          spanner::Transaction const& txn) -> StatusOr<spanner::Mutations> {
        auto b1 = get_current_budget(client, txn, 1, 1);
        if (!b1) return std::move(b1).status();
        auto b2 = get_current_budget(client, txn, 2, 2);
        if (!b2) return std::move(b2).status();
        std::int64_t transfer_amount = 200000;

        return spanner::Mutations{
            spanner::UpdateMutationBuilder(
                "Albums", {"SingerId", "AlbumId", "MarketingBudget"})
                .EmplaceRow(1, 1, *b1 + transfer_amount)
                .EmplaceRow(2, 2, *b2 - transfer_amount)
                .Build()};
      });

  if (!commit) throw std::move(commit).status();
  std::cout << "Transfer was successful [spanner_read_write_transaction]\n";
}

C#


using Google.Cloud.Spanner.Data;
using System;
using System.Threading.Tasks;
using System.Transactions;

public class ReadWriteWithTransactionAsyncSample
{
    public async Task<int> ReadWriteWithTransactionAsync(string projectId, string instanceId, string databaseId)
    {
        // This sample transfers 200,000 from the MarketingBudget
        // field of the second Album to the first Album. Make sure to run
        // the Add Column and Write Data To New Column samples first,
        // in that order.

        string connectionString = $"Data Source=projects/{projectId}/instances/{instanceId}/databases/{databaseId}";

        using TransactionScope scope = new TransactionScope(TransactionScopeAsyncFlowOption.Enabled);
        decimal transferAmount = 200000;
        decimal secondBudget = 0;
        decimal firstBudget = 0;

        using var connection = new SpannerConnection(connectionString);
        using var cmdLookup1 = connection.CreateSelectCommand("SELECT * FROM Albums WHERE SingerId = 2 AND AlbumId = 2");

        using (var reader = await cmdLookup1.ExecuteReaderAsync())
        {
            while (await reader.ReadAsync())
            {
                // Read the second album's budget.
                secondBudget = reader.GetFieldValue<decimal>("MarketingBudget");
                // Confirm second Album's budget is sufficient and
                // if not raise an exception. Raising an exception
                // will automatically roll back the transaction.
                if (secondBudget < transferAmount)
                {
                    throw new Exception($"The second album's budget {secondBudget} is less than the amount to transfer.");
                }
            }
        }

        // Read the first album's budget.
        using var cmdLookup2 = connection.CreateSelectCommand("SELECT * FROM Albums WHERE SingerId = 1 and AlbumId = 1");
        using (var reader = await cmdLookup2.ExecuteReaderAsync())
        {
            while (await reader.ReadAsync())
            {
                firstBudget = reader.GetFieldValue<decimal>("MarketingBudget");
            }
        }

        // Specify update command parameters.
        using var cmdUpdate = connection.CreateUpdateCommand("Albums", new SpannerParameterCollection
        {
            { "SingerId", SpannerDbType.Int64 },
            { "AlbumId", SpannerDbType.Int64 },
            { "MarketingBudget", SpannerDbType.Int64 },
        });

        // Update second album to remove the transfer amount.
        secondBudget -= transferAmount;
        cmdUpdate.Parameters["SingerId"].Value = 2;
        cmdUpdate.Parameters["AlbumId"].Value = 2;
        cmdUpdate.Parameters["MarketingBudget"].Value = secondBudget;
        var rowCount = await cmdUpdate.ExecuteNonQueryAsync();

        // Update first album to add the transfer amount.
        firstBudget += transferAmount;
        cmdUpdate.Parameters["SingerId"].Value = 1;
        cmdUpdate.Parameters["AlbumId"].Value = 1;
        cmdUpdate.Parameters["MarketingBudget"].Value = firstBudget;
        rowCount += await cmdUpdate.ExecuteNonQueryAsync();
        scope.Complete();
        Console.WriteLine("Transaction complete.");
        return rowCount;
    }
}

Go


import (
	"context"
	"fmt"
	"io"

	"cloud.google.com/go/spanner"
)

func writeWithTransaction(w io.Writer, db string) error {
	ctx := context.Background()
	client, err := spanner.NewClient(ctx, db)
	if err != nil {
		return err
	}
	defer client.Close()

	_, err = client.ReadWriteTransaction(ctx, func(ctx context.Context, txn *spanner.ReadWriteTransaction) error {
		getBudget := func(key spanner.Key) (int64, error) {
			row, err := txn.ReadRow(ctx, "Albums", key, []string{"MarketingBudget"})
			if err != nil {
				return 0, err
			}
			var budget int64
			if err := row.Column(0, &budget); err != nil {
				return 0, err
			}
			return budget, nil
		}
		album2Budget, err := getBudget(spanner.Key{2, 2})
		if err != nil {
			return err
		}
		const transferAmt = 200000
		if album2Budget >= transferAmt {
			album1Budget, err := getBudget(spanner.Key{1, 1})
			if err != nil {
				return err
			}
			album1Budget += transferAmt
			album2Budget -= transferAmt
			cols := []string{"SingerId", "AlbumId", "MarketingBudget"}
			txn.BufferWrite([]*spanner.Mutation{
				spanner.Update("Albums", cols, []interface{}{1, 1, album1Budget}),
				spanner.Update("Albums", cols, []interface{}{2, 2, album2Budget}),
			})
			fmt.Fprintf(w, "Moved %d from Album2's MarketingBudget to Album1's.", transferAmt)
		}
		return nil
	})
	return err
}

Java

static void writeWithTransaction(DatabaseClient dbClient) {
  dbClient
      .readWriteTransaction()
      .run(transaction -> {
        // Transfer marketing budget from one album to another. We do it in a transaction to
        // ensure that the transfer is atomic.
        Struct row =
            transaction.readRow("Albums", Key.of(2, 2), Arrays.asList("MarketingBudget"));
        long album2Budget = row.getLong(0);
        // Transaction will only be committed if this condition still holds at the time of
        // commit. Otherwise it will be aborted and the callable will be rerun by the
        // client library.
        long transfer = 200000;
        if (album2Budget >= transfer) {
          long album1Budget =
              transaction
                  .readRow("Albums", Key.of(1, 1), Arrays.asList("MarketingBudget"))
                  .getLong(0);
          album1Budget += transfer;
          album2Budget -= transfer;
          transaction.buffer(
              Mutation.newUpdateBuilder("Albums")
                  .set("SingerId")
                  .to(1)
                  .set("AlbumId")
                  .to(1)
                  .set("MarketingBudget")
                  .to(album1Budget)
                  .build());
          transaction.buffer(
              Mutation.newUpdateBuilder("Albums")
                  .set("SingerId")
                  .to(2)
                  .set("AlbumId")
                  .to(2)
                  .set("MarketingBudget")
                  .to(album2Budget)
                  .build());
        }
        return null;
      });
}

Node.js

// This sample transfers 200,000 from the MarketingBudget field
// of the second Album to the first Album, as long as the second
// Album has enough money in its budget. Make sure to run the
// addColumn and updateData samples first (in that order).

// Imports the Google Cloud client library
const {Spanner} = require('@google-cloud/spanner');

/**
 * TODO(developer): Uncomment the following lines before running the sample.
 */
// const projectId = 'my-project-id';
// const instanceId = 'my-instance';
// const databaseId = 'my-database';

// Creates a client
const spanner = new Spanner({
  projectId: projectId,
});

// Gets a reference to a Cloud Spanner instance and database
const instance = spanner.instance(instanceId);
const database = instance.database(databaseId);

const transferAmount = 200000;

// Note: the `runTransaction()` method is non blocking and returns "void".
// For sequential execution of the transaction use `runTransactionAsync()` method which returns a promise.
// For example: await database.runTransactionAsync(async (err, transaction) => { ... })
database.runTransaction(async (err, transaction) => {
  if (err) {
    console.error(err);
    return;
  }
  let firstBudget, secondBudget;
  const queryOne = {
    columns: ['MarketingBudget'],
    keys: [[2, 2]], // SingerId: 2, AlbumId: 2
  };

  const queryTwo = {
    columns: ['MarketingBudget'],
    keys: [[1, 1]], // SingerId: 1, AlbumId: 1
  };

  Promise.all([
    // Reads the second album's budget
    transaction.read('Albums', queryOne).then(results => {
      // Gets second album's budget
      const rows = results[0].map(row => row.toJSON());
      secondBudget = rows[0].MarketingBudget;
      console.log(`The second album's marketing budget: ${secondBudget}`);

      // Makes sure the second album's budget is large enough
      if (secondBudget < transferAmount) {
        throw new Error(
          `The second album's budget (${secondBudget}) is less than the transfer amount (${transferAmount}).`,
        );
      }
    }),

    // Reads the first album's budget
    transaction.read('Albums', queryTwo).then(results => {
      // Gets first album's budget
      const rows = results[0].map(row => row.toJSON());
      firstBudget = rows[0].MarketingBudget;
      console.log(`The first album's marketing budget: ${firstBudget}`);
    }),
  ])
    .then(() => {
      console.log(firstBudget, secondBudget);
      // Transfers the budgets between the albums
      firstBudget += transferAmount;
      secondBudget -= transferAmount;

      console.log(firstBudget, secondBudget);

      // Updates the database
      // Note: Cloud Spanner interprets Node.js numbers as FLOAT64s, so they
      // must be converted (back) to strings before being inserted as INT64s.
      transaction.update('Albums', [
        {
          SingerId: '1',
          AlbumId: '1',
          MarketingBudget: firstBudget.toString(),
        },
        {
          SingerId: '2',
          AlbumId: '2',
          MarketingBudget: secondBudget.toString(),
        },
      ]);
    })
    .then(() => {
      // Commits the transaction and send the changes to the database
      return transaction.commit();
    })
    .then(() => {
      console.log(
        `Successfully executed read-write transaction to transfer ${transferAmount} from Album 2 to Album 1.`,
      );
    })
    .catch(err => {
      console.error('ERROR:', err);
    })
    .then(() => {
      transaction.end();
      // Closes the database when finished
      return database.close();
    });
});

PHP

use Google\Cloud\Spanner\SpannerClient;
use Google\Cloud\Spanner\Transaction;
use UnexpectedValueException;

/**
 * Performs a read-write transaction to update two sample records in the
 * database.
 *
 * This will transfer 200,000 from the `MarketingBudget` field for the second
 * Album to the first Album. If the `MarketingBudget` for the second Album is
 * too low, it will raise an exception.
 *
 * Before running this sample, you will need to run the `update_data` sample
 * to populate the fields.
 * Example:
 * ```
 * read_write_transaction($instanceId, $databaseId);
 * ```
 *
 * @param string $instanceId The Spanner instance ID.
 * @param string $databaseId The Spanner database ID.
 */
function read_write_transaction(string $instanceId, string $databaseId): void
{
    $spanner = new SpannerClient();
    $instance = $spanner->instance($instanceId);
    $database = $instance->database($databaseId);

    $database->runTransaction(function (Transaction $t) use ($spanner) {
        $transferAmount = 200000;

        // Read the second album's budget.
        $secondAlbumKey = [2, 2];
        $secondAlbumKeySet = $spanner->keySet(['keys' => [$secondAlbumKey]]);
        $secondAlbumResult = $t->read(
            'Albums',
            $secondAlbumKeySet,
            ['MarketingBudget'],
            ['limit' => 1]
        );

        $firstRow = $secondAlbumResult->rows()->current();
        $secondAlbumBudget = $firstRow['MarketingBudget'];
        if ($secondAlbumBudget < $transferAmount) {
            // Throwing an exception will automatically roll back the transaction.
            throw new UnexpectedValueException(
                'The second album\'s budget is lower than the transfer amount: ' . $transferAmount
            );
        }

        $firstAlbumKey = [1, 1];
        $firstAlbumKeySet = $spanner->keySet(['keys' => [$firstAlbumKey]]);
        $firstAlbumResult = $t->read(
            'Albums',
            $firstAlbumKeySet,
            ['MarketingBudget'],
            ['limit' => 1]
        );

        // Read the first album's budget.
        $firstRow = $firstAlbumResult->rows()->current();
        $firstAlbumBudget = $firstRow['MarketingBudget'];

        // Update the budgets.
        $secondAlbumBudget -= $transferAmount;
        $firstAlbumBudget += $transferAmount;
        printf('Setting first album\'s budget to %s and the second album\'s ' .
            'budget to %s.' . PHP_EOL, $firstAlbumBudget, $secondAlbumBudget);

        // Update the rows.
        $t->updateBatch('Albums', [
            ['SingerId' => 1, 'AlbumId' => 1, 'MarketingBudget' => $firstAlbumBudget],
            ['SingerId' => 2, 'AlbumId' => 2, 'MarketingBudget' => $secondAlbumBudget],
        ]);

        // Commit the transaction!
        $t->commit();

        print('Transaction complete.' . PHP_EOL);
    });
}

Python

def read_write_transaction(instance_id, database_id):
    """Performs a read-write transaction to update two sample records in the
    database.

    This will transfer 200,000 from the `MarketingBudget` field for the second
    Album to the first Album. If the `MarketingBudget` is too low, it will
    raise an exception.

    Before running this sample, you will need to run the `update_data` sample
    to populate the fields.
    """
    spanner_client = spanner.Client()
    instance = spanner_client.instance(instance_id)
    database = instance.database(database_id)

    def update_albums(transaction):
        # Read the second album budget.
        second_album_keyset = spanner.KeySet(keys=[(2, 2)])
        second_album_result = transaction.read(
            table="Albums",
            columns=("MarketingBudget",),
            keyset=second_album_keyset,
            limit=1,
        )
        second_album_row = list(second_album_result)[0]
        second_album_budget = second_album_row[0]

        transfer_amount = 200000

        if second_album_budget < transfer_amount:
            # Raising an exception will automatically roll back the
            # transaction.
            raise ValueError("The second album doesn't have enough funds to transfer")

        # Read the first album's budget.
        first_album_keyset = spanner.KeySet(keys=[(1, 1)])
        first_album_result = transaction.read(
            table="Albums",
            columns=("MarketingBudget",),
            keyset=first_album_keyset,
            limit=1,
        )
        first_album_row = list(first_album_result)[0]
        first_album_budget = first_album_row[0]

        # Update the budgets.
        second_album_budget -= transfer_amount
        first_album_budget += transfer_amount
        print(
            "Setting first album's budget to {} and the second album's "
            "budget to {}.".format(first_album_budget, second_album_budget)
        )

        # Update the rows.
        transaction.update(
            table="Albums",
            columns=("SingerId", "AlbumId", "MarketingBudget"),
            values=[(1, 1, first_album_budget), (2, 2, second_album_budget)],
        )

    database.run_in_transaction(update_albums)

    print("Transaction complete.")

Ruby

# project_id  = "Your Google Cloud project ID"
# instance_id = "Your Spanner instance ID"
# database_id = "Your Spanner database ID"

require "google/cloud/spanner"

spanner         = Google::Cloud::Spanner.new project: project_id
client          = spanner.client instance_id, database_id
transfer_amount = 200_000

client.transaction do |transaction|
  first_album  = transaction.read("Albums", [:MarketingBudget], keys: [[1, 1]]).rows.first
  second_album = transaction.read("Albums", [:MarketingBudget], keys: [[2, 2]]).rows.first

  raise "The second album does not have enough funds to transfer" if second_album[:MarketingBudget] < transfer_amount

  new_first_album_budget  = first_album[:MarketingBudget] + transfer_amount
  new_second_album_budget = second_album[:MarketingBudget] - transfer_amount

  transaction.update "Albums", [
    { SingerId: 1, AlbumId: 1, MarketingBudget: new_first_album_budget  },
    { SingerId: 2, AlbumId: 2, MarketingBudget: new_second_album_budget }
  ]
end

puts "Transaction complete"

Sémantique

Cette section décrit la sémantique des transactions en lecture-écriture dans Spanner.

Propriétés

L'isolation sérialisable est le niveau d'isolation par défaut dans Spanner. Avec l'isolation sérialisable, Spanner fournit aux clients les garanties les plus strictes en matière de contrôle de simultanéité pour les transactions, appelée cohérence externe. Une transaction en lecture-écriture exécute un ensemble de lectures et d'écritures de manière atomique. L'horodatage d'exécution des transactions en lecture-écriture correspond au temps écoulé. L'ordre de sérialisation correspond à l'ordre d'horodatage.

Les transactions en lecture-écriture fournissent les propriétés ACID des bases de données relationnelles. Les transactions en lecture-écriture Spanner offrent des propriétés plus solides que les transactions ACID classiques. Par conséquent, par défaut, Spanner permet aux écritures de se poursuivre sans être bloquées par des transactions en lecture seule, mais sans présenter les anomalies afférentes à l'isolation d'instantané. Ces propriétés aident les développeurs d'applications à se concentrer sur l'exactitude de chaque transaction, sans se soucier de la protection de son exécution par rapport à d'autres transactions pouvant être exécutées simultanément.

Vous pouvez également exécuter vos transactions en lecture/écriture à l'aide de l'isolation de lecture reproductible. L'isolation de lecture reproductible dans Spanner garantit que toutes les opérations de lecture d'une transaction voient un instantané cohérent ou fort de la base de données telle qu'elle existait au début de la transaction. Pour en savoir plus, consultez Isolation de lecture reproductible.

Transactions en lecture-écriture avec isolation sérialisable

Une fois une transaction contenant une série de lectures et d'écritures validée avec succès dans l'isolation sérialisable par défaut, les éléments suivants s'appliquent :

La transaction renvoie des valeurs qui reflètent un instantané cohérent à l'horodatage de validation de la transaction.
Les lignes ou plages vides le restent au moment de l'envoi.
La transaction valide toutes les écritures au code temporel de validation de la transaction.
Aucune transaction ne peut voir les écritures tant que la transaction n'est pas validée.

Les pilotes clients Spanner incluent une logique de nouvelle tentative de transaction qui masque les erreurs temporaires en relançant la transaction et en validant les données observées par le client.

Il en résulte que toutes les lectures et écritures semblent s'être produites à un moment donné, à la fois du point de vue de la transaction elle-même, et d'autres lecteurs et auteurs de la base de données Spanner. Cela signifie que les lectures et les écritures se produisent au même horodatage. Pour obtenir un exemple, consultez Sérialisabilité et cohérence externe.

Transactions en lecture-écriture avec isolation de lecture répétable

Une fois une transaction validée avec succès avec un niveau d'isolation "Repeatable Read", les règles suivantes s'appliquent :

La transaction renvoie des valeurs qui reflètent un instantané cohérent de la base de données. L'instantané est généralement établi lors de la première opération de transaction, qui peut être différente du code temporel de validation.
Étant donné que la lecture reproductible est implémentée à l'aide de l'isolation par instantané, la transaction valide toutes les écritures à l'horodatage de validation de la transaction uniquement si l'ensemble d'écriture n'a pas changé entre l'horodatage de l'instantané de la transaction et l'horodatage de validation.
Les autres transactions ne voient pas les écritures tant que la première transaction n'est pas validée.

Isolation pour les transactions de lecture et d'écriture avec des opérations en lecture seule

Lorsqu'une transaction en lecture-écriture n'effectue que des opérations de lecture, elle offre des garanties de cohérence similaires à celles d'une transaction en lecture seule. Toutes les lectures de la transaction renvoient des données d'un horodatage cohérent, y compris la confirmation des lignes inexistantes.

Une différence se produit lorsqu'une transaction en lecture-écriture est validée sans exécuter d'opération d'écriture. Dans ce scénario, rien ne garantit que les données lues dans la transaction sont restées inchangées dans la base de données entre l'opération de lecture et la validation de la transaction.

Pour garantir la fraîcheur des données et valider qu'elles n'ont pas été modifiées depuis leur dernière récupération, une lecture ultérieure est requise. Cette relecture peut être effectuée dans une autre transaction de lecture-écriture ou avec une lecture forte.

Pour une efficacité optimale, si une transaction effectue exclusivement des lectures, utilisez une transaction en lecture seule au lieu d'une transaction en lecture-écriture.

Atomicité, cohérence, durabilité

En plus de l'isolation, Spanner fournit les autres garanties de propriétés ACID :

Atomicité : une transaction est considérée comme atomique si toutes ses opérations sont effectuées avec succès, ou aucune. Si une opération d'une transaction échoue, l'ensemble de la transaction est annulé et revient à son état d'origine, ce qui garantit l'intégrité des données.
Cohérence : une transaction doit maintenir l'intégrité des règles et des contraintes de la base de données. Une fois une transaction terminée, la base de données doit être dans un état valide, en respectant les règles prédéfinies.
Durabilité : une fois qu'une transaction est validée, ses modifications sont stockées de manière permanente dans la base de données et persistent en cas de défaillance du système, de panne de courant ou d'autres perturbations.

Sérialisabilité et cohérence externe

Par défaut, Spanner offre de solides garanties transactionnelles, y compris la sérialisabilité et la cohérence externe. Ces propriétés garantissent que les données restent cohérentes et que les opérations se déroulent dans un ordre prévisible, même dans un environnement distribué.

La sérialisabilité garantit que toutes les transactions semblent s'exécuter les unes après les autres dans un ordre séquentiel unique, même si elles sont traitées simultanément. Pour ce faire, Spanner attribue des codes temporels de commit aux transactions, qui reflètent l'ordre dans lequel elles ont été validées.

Spanner offre une garantie encore plus solide, appelée cohérence externe. Cela signifie que non seulement les transactions sont validées dans un ordre reflété par leur horodatage de commit, mais que ces horodatages sont également alignés sur l'heure réelle. Cela vous permet de comparer les codes temporels de commit au temps réel, ce qui vous donne une vue cohérente et ordonnée à l'échelle mondiale de vos données.

En substance, si une transaction Txn1 est validée avant une autre transaction Txn2 en temps réel, l'horodatage de validation de Txn1 est antérieur à celui de Txn2.

Prenons l'exemple suivant :

Chronologie montrant l'exécution de deux transactions qui lisent les mêmes données

Dans ce scénario, pendant la période t :

La transaction Txn1 lit les données A, prépare une écriture dans A, puis est validée.
La transaction Txn2 commence après le début de la transaction Txn1. Il lit les données B, puis les données A.

Même si Txn2 a commencé avant la fin de Txn1, Txn2 observe les modifications apportées par Txn1 à A. En effet, Txn2 lit A après que Txn1 a validé son écriture dans A.

Bien que les temps d'exécution de Txn1 et Txn2 puissent se chevaucher, leurs codes temporels de validation, c1 et c2 respectivement, imposent un ordre de transaction linéaire. Cela signifie :

Toutes les lectures et écritures dans Txn1 semblent s'être produites à un moment précis, c1.
Toutes les lectures et écritures dans Txn2 semblent s'être produites à un moment précis, c2.
Il est essentiel de noter que c1 est antérieur à c2 pour les écritures validées, même si les écritures ont eu lieu sur des machines différentes. Si Txn2 n'effectue que des lectures, c1 est antérieur ou simultané à c2.

Cet ordre fort signifie que si une opération de lecture ultérieure observe les effets de Txn2, elle observe également les effets de Txn1. Cette propriété est définie sur "true" pour toutes les transactions validées.

En revanche, si vous utilisez l'isolation de lecture reproductible, le scénario suivant se produit pour les mêmes transactions :

Txn1 commence par lire les données A, en créant son propre instantané de la base de données à ce moment-là.
Txn2 commence alors, lit les données B et établit son propre instantané.
Ensuite, Txn1 modifie les données A et valide correctement ses modifications.
Txn2 tentatives de lecture des données A. Il est important de noter que, comme il fonctionne sur un instantané antérieur, Txn2 ne voit pas la mise à jour Txn1 qui vient d'être apportée à A. Txn2 lit l'ancienne valeur.
Txn2 modifie les données B et les valide.

Dans ce scénario, chaque transaction fonctionne sur son propre instantané cohérent de la base de données, pris au moment où la transaction démarre. Cette séquence peut entraîner une anomalie de biais d'écriture si l'écriture dans B par Txn2 était logiquement dépendante de la valeur lue à partir de A. En substance, Txn2 a effectué ses mises à jour sur la base d'informations obsolètes, et son écriture ultérieure peut enfreindre un invariant au niveau de l'application. Pour éviter ce scénario, envisagez d'utiliser SELECT...FOR UPDATE pour l'isolation de lecture répétable ou de créer des contraintes de vérification dans votre schéma.

Garanties de lecture et d'écriture en cas d'échec d'une transaction

Si un appel à exécuter une transaction échoue, les garanties en lecture et en écriture dépendent de l'erreur qui a entraîné l'échec de l'appel de commit sous-jacent.

Par exemple, une erreur telle que "Ligne non trouvée" ou "Ligne déjà existante" signifie que l'écriture des mutations mises en mémoire tampon a rencontré une erreur, par exemple une des lignes que le client tente de mettre à jour n'existe pas. Dans ce cas, les lectures sont garanties cohérentes, les écritures ne sont pas appliquées et la non-existence de la ligne est également garantie cohérente avec les lectures.

Garanties de lecture et d'écriture en cas d'échec d'une transaction

Lorsqu'une transaction Spanner échoue, les garanties que vous recevez pour les lectures et les écritures dépendent de l'erreur spécifique rencontrée lors de l'opération commit.

Par exemple, un message d'erreur tel que "Ligne non trouvée" ou "Ligne déjà existante" indique un problème lors de l'écriture des mutations mises en mémoire tampon. Cela peut se produire si, par exemple, une ligne que le client tente de mettre à jour n'existe pas. Dans les scénarios suivants :

Les lectures sont cohérentes : toutes les données lues pendant la transaction sont garanties cohérentes jusqu'au moment de l'erreur.
Les écritures ne sont pas appliquées : les mutations que la transaction a tentées ne sont pas validées dans la base de données.
Cohérence des lignes : l'inexistence (ou l'état existant) de la ligne qui a déclenché l'erreur est cohérente avec les lectures effectuées dans la transaction.

Vous pouvez annuler à tout moment les opérations de lecture asynchrones dans Spanner sans affecter les autres opérations en cours dans la même transaction. Cette flexibilité est utile si une opération de niveau supérieur est annulée ou si vous décidez d'abandonner une lecture en fonction des résultats initiaux.

Toutefois, il est important de comprendre que demander l'annulation d'une lecture ne garantit pas son arrêt immédiat. Après une demande d'annulation, l'opération de lecture peut toujours :

Opération terminée : il est possible que le traitement de la lecture se termine et renvoie des résultats avant que l'annulation ne prenne effet.
Échec pour une autre raison : la lecture peut se terminer en raison d'une autre erreur, telle qu'une annulation.
Renvoyer des résultats incomplets : la lecture peut renvoyer des résultats partiels, qui sont ensuite validés dans le cadre du processus de commit de la transaction.

Il est également important de noter la distinction avec les opérations de transaction commit : l'annulation d'une opération commit interrompt l'intégralité de la transaction, sauf si elle a déjà été validée ou a échoué pour une autre raison.

Performances

Cette section décrit les problèmes qui affectent les performances des transactions en lecture/écriture.

Contrôle de simultanéité par verrouillage

Par défaut, Spanner permet à plusieurs clients d'interagir simultanément avec la même base de données dans son niveau d'isolation sérialisable par défaut. Pour maintenir la cohérence des données entre ces transactions simultanées, Spanner dispose d'un mécanisme de verrouillage qui utilise à la fois des verrous partagés et exclusifs. Ces verrous de lecture ne sont acquis que pour les transactions sérialisables, mais pas pour celles qui utilisent l'isolation de lecture reproductible.

Lorsqu'une transaction sérialisable effectue une opération de lecture, Spanner acquiert des verrous en lecture partagés sur les données concernées. Ces verrous partagés permettent à d'autres opérations de lecture simultanées d'accéder aux mêmes données. Cette simultanéité est maintenue jusqu'à ce que votre transaction se prépare à valider ses modifications.

Pendant la phase de validation, à mesure que les écritures sont appliquées, la transaction tente de passer à des verrous exclusifs. Pour ce faire, il effectue les opérations suivantes :

Bloque toutes les nouvelles demandes de verrouillage en lecture partagé sur les données concernées.
Attend que tous les verrous en lecture partagés existants sur ces données soient levés.
Une fois tous les verrous en lecture partagés annulés, il place un verrou exclusif, lui accordant un accès exclusif aux données pendant la durée de l'écriture.

Notes au sujet des verrous :

Granularité : Spanner applique les verrous au niveau des lignes et des colonnes. Cela signifie que si la transaction T1 détient un verrou sur la colonne A de la ligne albumid, la transaction T2 peut toujours écrire simultanément dans la colonne B de la même ligne albumid sans conflit.
Écritures sans lectures : pour les écritures sans lectures, Spanner n'a pas besoin de verrou exclusif. Il utilise plutôt un verrou partagé pour l'auteur. En effet, l'ordre d'application des écritures sans lectures est déterminé par leurs codes temporels de validation, ce qui permet à plusieurs rédacteurs d'opérer simultanément sur le même élément sans conflit. Un verrou exclusif n'est nécessaire que si votre transaction lit d'abord les données qu'elle a l'intention d'écrire.
Index secondaires pour les recherches de lignes : lorsque vous effectuez des recherches de lignes dans une transaction en lecture/écriture, l'utilisation d'index secondaires peut améliorer considérablement les performances. En utilisant des index secondaires pour limiter les lignes analysées à une plage plus petite, Spanner verrouille moins de lignes dans la table, ce qui permet de modifier simultanément un plus grand nombre de lignes en dehors de cette plage spécifique.
Accès exclusif aux ressources externes : les verrous internes de Spanner sont conçus pour assurer la cohérence des données au sein de la base de données Spanner elle-même. Ne les utilisez pas pour garantir un accès exclusif aux ressources en dehors de Spanner. Spanner peut annuler des transactions pour diverses raisons, y compris des optimisations système internes telles que le déplacement de données entre les ressources de calcul. Si une transaction est relancée (explicitement par votre code d'application ou implicitement par des bibliothèques clientes comme le pilote JDBC Spanner), la seule garantie est le maintien des verrous pendant la tentative de commit réussie.
Statistiques de verrouillage : pour diagnostiquer et examiner les conflits de verrouillage dans votre base de données, vous pouvez utiliser l'outil d'introspection Statistiques de verrouillage.

Détection des blocages

Spanner détecte le blocage potentiel de plusieurs transactions et impose l'abandon de toutes les transactions sauf une. Prenons l'exemple suivant : Txn1 maintient un verrou sur l'enregistrement A et attend un verrou sur l'enregistrement B, tandis que Txn2 maintient un verrou sur l'enregistrement B et attend un verrou sur l'enregistrement A. Pour résoudre ce problème, l'une des transactions doit être annulée, ce qui libère son verrouillage et permet à l'autre de se poursuivre.

Spanner utilise l'algorithme standard wound-wait pour la détection des blocages. En arrière-plan, Spanner conserve une trace de l'âge de chaque transaction ayant entraîné des conflits de verrouillage. Il permet aux transactions plus anciennes d'abandonner les transactions plus récentes. Une transaction plus ancienne est une transaction dont la lecture, la requête ou le commit les plus anciens ont eu lieu plus tôt.

En donnant la priorité aux transactions plus anciennes, Spanner garantit que chaque transaction finit par obtenir des verrous une fois que son ancienneté est devenue suffisante pour lui donner une priorité plus élevée. Par exemple, une transaction plus ancienne nécessitant un verrou partagé pour l'auteur peut annuler une transaction plus récente contenant un verrou partagé pour le lecteur.

Exécution distribuée

Spanner peut exécuter des transactions sur les données couvrant plusieurs serveurs, mais cette fonctionnalité a un coût en termes de performances par rapport aux transactions sur un seul serveur.

Quels types de transactions peuvent être distribués ? Spanner peut répartir la responsabilité des lignes de la base de données sur plusieurs serveurs. En règle générale, une ligne et les lignes de table entrelacées correspondantes sont diffusées par le même serveur, comme le sont deux lignes d'une même table ayant des clés proches. Spanner peut effectuer des transactions sur plusieurs lignes sur différents serveurs. Cependant, en règle générale, les transactions qui affectent de nombreuses lignes colocalisées sont plus rapides et moins coûteuses que celles qui affectent de nombreuses lignes dispersées dans la base de données ou dans une grande table.

Les transactions les plus efficaces dans Spanner n'incluent que les lectures et les écritures qui doivent être appliquées de manière atomique. Les transactions sont plus rapides lorsque toutes les lectures et écritures accèdent aux données dans une même partie de l'espace clé.

Transactions en lecture seule

En plus du verrouillage des transactions en lecture-écriture, Spanner offre des transactions en lecture seule.

Utilisez une transaction en lecture seule lorsque vous devez exécuter plusieurs lectures au même horodatage. Si vous pouvez exprimer votre lecture à l'aide de l'une des méthodes de lecture unique de Spanner, utilisez plutôt cette méthode. Les performances liées à l'utilisation d'un appel en lecture unique devraient être comparables à celles d'une lecture unique effectuée dans une transaction en lecture seule.

Si vous lisez une grande quantité de données, envisagez d'utiliser des partitions pour lire les données en parallèle.

Parce que les transactions en lecture seule n'effectuent aucune écriture, elles ne peuvent ni être verrouillées, ni bloquer les autres transactions. Les transactions en lecture seule observent un préfixe cohérent de l'historique de commit des transactions. De la sorte, votre application obtient toujours des données cohérentes.

Interface

Spanner fournit une interface pour l'exécution de tâches dans le contexte d'une transaction en lecture seule, avec la possibilité de nouvelles tentatives d'exécution en cas d'échec de la transaction.

Exemple

L'exemple suivant montre comment utiliser une transaction en lecture seule afin d'obtenir des données cohérentes pour deux lectures au même horodatage :

C++

void ReadOnlyTransaction(google::cloud::spanner::Client client) {
  namespace spanner = ::google::cloud::spanner;
  auto read_only = spanner::MakeReadOnlyTransaction();

  spanner::SqlStatement select(
      "SELECT SingerId, AlbumId, AlbumTitle FROM Albums");
  using RowType = std::tuple<std::int64_t, std::int64_t, std::string>;

  // Read#1.
  auto rows1 = client.ExecuteQuery(read_only, select);
  std::cout << "Read 1 results\n";
  for (auto& row : spanner::StreamOf<RowType>(rows1)) {
    if (!row) throw std::move(row).status();
    std::cout << "SingerId: " << std::get<0>(*row)
              << " AlbumId: " << std::get<1>(*row)
              << " AlbumTitle: " << std::get<2>(*row) << "\n";
  }
  // Read#2. Even if changes occur in-between the reads the transaction ensures
  // that Read #1 and Read #2 return the same data.
  auto rows2 = client.ExecuteQuery(read_only, select);
  std::cout << "Read 2 results\n";
  for (auto& row : spanner::StreamOf<RowType>(rows2)) {
    if (!row) throw std::move(row).status();
    std::cout << "SingerId: " << std::get<0>(*row)
              << " AlbumId: " << std::get<1>(*row)
              << " AlbumTitle: " << std::get<2>(*row) << "\n";
  }
}

C#


using Google.Cloud.Spanner.Data;
using System;
using System.Collections.Generic;
using System.Threading.Tasks;
using System.Transactions;

public class QueryDataWithTransactionAsyncSample
{
    public class Album
    {
        public int SingerId { get; set; }
        public int AlbumId { get; set; }
        public string AlbumTitle { get; set; }
    }

    public async Task<List<Album>> QueryDataWithTransactionAsync(string projectId, string instanceId, string databaseId)
    {
        string connectionString = $"Data Source=projects/{projectId}/instances/{instanceId}/databases/{databaseId}";

        var albums = new List<Album>();
        using TransactionScope scope = new TransactionScope(TransactionScopeAsyncFlowOption.Enabled);
        using var connection = new SpannerConnection(connectionString);

        // Opens the connection so that the Spanner transaction included in the TransactionScope
        // is read-only TimestampBound.Strong.
        await connection.OpenAsync(SpannerTransactionCreationOptions.ReadOnly, options: null, cancellationToken: default);
        using var cmd = connection.CreateSelectCommand("SELECT SingerId, AlbumId, AlbumTitle FROM Albums");

        // Read #1.
        using (var reader = await cmd.ExecuteReaderAsync())
        {
            while (await reader.ReadAsync())
            {
                Console.WriteLine("SingerId : " + reader.GetFieldValue<string>("SingerId")
                    + " AlbumId : " + reader.GetFieldValue<string>("AlbumId")
                    + " AlbumTitle : " + reader.GetFieldValue<string>("AlbumTitle"));
            }
        }

        // Read #2. Even if changes occur in-between the reads,
        // the transaction ensures that Read #1 and Read #2
        // return the same data.
        using (var reader = await cmd.ExecuteReaderAsync())
        {
            while (await reader.ReadAsync())
            {
                albums.Add(new Album
                {
                    AlbumId = reader.GetFieldValue<int>("AlbumId"),
                    SingerId = reader.GetFieldValue<int>("SingerId"),
                    AlbumTitle = reader.GetFieldValue<string>("AlbumTitle")
                });
            }
        }
        scope.Complete();
        Console.WriteLine("Transaction complete.");
        return albums;
    }
}

Go


import (
	"context"
	"fmt"
	"io"

	"cloud.google.com/go/spanner"
	"google.golang.org/api/iterator"
)

func readOnlyTransaction(w io.Writer, db string) error {
	ctx := context.Background()
	client, err := spanner.NewClient(ctx, db)
	if err != nil {
		return err
	}
	defer client.Close()

	ro := client.ReadOnlyTransaction()
	defer ro.Close()
	stmt := spanner.Statement{SQL: `SELECT SingerId, AlbumId, AlbumTitle FROM Albums`}
	iter := ro.Query(ctx, stmt)
	defer iter.Stop()
	for {
		row, err := iter.Next()
		if err == iterator.Done {
			break
		}
		if err != nil {
			return err
		}
		var singerID int64
		var albumID int64
		var albumTitle string
		if err := row.Columns(&singerID, &albumID, &albumTitle); err != nil {
			return err
		}
		fmt.Fprintf(w, "%d %d %s\n", singerID, albumID, albumTitle)
	}

	iter = ro.Read(ctx, "Albums", spanner.AllKeys(), []string{"SingerId", "AlbumId", "AlbumTitle"})
	defer iter.Stop()
	for {
		row, err := iter.Next()
		if err == iterator.Done {
			return nil
		}
		if err != nil {
			return err
		}
		var singerID int64
		var albumID int64
		var albumTitle string
		if err := row.Columns(&singerID, &albumID, &albumTitle); err != nil {
			return err
		}
		fmt.Fprintf(w, "%d %d %s\n", singerID, albumID, albumTitle)
	}
}

Java

static void readOnlyTransaction(DatabaseClient dbClient) {
  // ReadOnlyTransaction must be closed by calling close() on it to release resources held by it.
  // We use a try-with-resource block to automatically do so.
  try (ReadOnlyTransaction transaction = dbClient.readOnlyTransaction()) {
    try (ResultSet queryResultSet =
        transaction.executeQuery(
            Statement.of("SELECT SingerId, AlbumId, AlbumTitle FROM Albums"))) {
      while (queryResultSet.next()) {
        System.out.printf(
            "%d %d %s\n",
            queryResultSet.getLong(0), queryResultSet.getLong(1), queryResultSet.getString(2));
      }
    } // queryResultSet.close() is automatically called here
    try (ResultSet readResultSet =
        transaction.read(
          "Albums", KeySet.all(), Arrays.asList("SingerId", "AlbumId", "AlbumTitle"))) {
      while (readResultSet.next()) {
        System.out.printf(
            "%d %d %s\n",
            readResultSet.getLong(0), readResultSet.getLong(1), readResultSet.getString(2));
      }
    } // readResultSet.close() is automatically called here
  } // transaction.close() is automatically called here
}

Node.js

// Imports the Google Cloud client library
const {Spanner} = require('@google-cloud/spanner');

/**
 * TODO(developer): Uncomment the following lines before running the sample.
 */
// const projectId = 'my-project-id';
// const instanceId = 'my-instance';
// const databaseId = 'my-database';

// Creates a client
const spanner = new Spanner({
  projectId: projectId,
});

// Gets a reference to a Cloud Spanner instance and database
const instance = spanner.instance(instanceId);
const database = instance.database(databaseId);

// Gets a transaction object that captures the database state
// at a specific point in time
database.getSnapshot(async (err, transaction) => {
  if (err) {
    console.error(err);
    return;
  }
  const queryOne = 'SELECT SingerId, AlbumId, AlbumTitle FROM Albums';

  try {
    // Read #1, using SQL
    const [qOneRows] = await transaction.run(queryOne);

    qOneRows.forEach(row => {
      const json = row.toJSON();
      console.log(
        `SingerId: ${json.SingerId}, AlbumId: ${json.AlbumId}, AlbumTitle: ${json.AlbumTitle}`,
      );
    });

    const queryTwo = {
      columns: ['SingerId', 'AlbumId', 'AlbumTitle'],
    };

    // Read #2, using the `read` method. Even if changes occur
    // in-between the reads, the transaction ensures that both
    // return the same data.
    const [qTwoRows] = await transaction.read('Albums', queryTwo);

    qTwoRows.forEach(row => {
      const json = row.toJSON();
      console.log(
        `SingerId: ${json.SingerId}, AlbumId: ${json.AlbumId}, AlbumTitle: ${json.AlbumTitle}`,
      );
    });

    console.log('Successfully executed read-only transaction.');
  } catch (err) {
    console.error('ERROR:', err);
  } finally {
    transaction.end();
    // Close the database when finished.
    await database.close();
  }
});

PHP

use Google\Cloud\Spanner\SpannerClient;

/**
 * Reads data inside of a read-only transaction.
 *
 * Within the read-only transaction, or "snapshot", the application sees
 * consistent view of the database at a particular timestamp.
 * Example:
 * ```
 * read_only_transaction($instanceId, $databaseId);
 * ```
 *
 * @param string $instanceId The Spanner instance ID.
 * @param string $databaseId The Spanner database ID.
 */
function read_only_transaction(string $instanceId, string $databaseId): void
{
    $spanner = new SpannerClient();
    $instance = $spanner->instance($instanceId);
    $database = $instance->database($databaseId);

    $snapshot = $database->snapshot();
    $results = $snapshot->execute(
        'SELECT SingerId, AlbumId, AlbumTitle FROM Albums'
    );
    print('Results from the first read:' . PHP_EOL);
    foreach ($results as $row) {
        printf('SingerId: %s, AlbumId: %s, AlbumTitle: %s' . PHP_EOL,
            $row['SingerId'], $row['AlbumId'], $row['AlbumTitle']);
    }

    // Perform another read using the `read` method. Even if the data
    // is updated in-between the reads, the snapshot ensures that both
    // return the same data.
    $keySet = $spanner->keySet(['all' => true]);
    $results = $database->read(
        'Albums',
        $keySet,
        ['SingerId', 'AlbumId', 'AlbumTitle']
    );

    print('Results from the second read:' . PHP_EOL);
    foreach ($results->rows() as $row) {
        printf('SingerId: %s, AlbumId: %s, AlbumTitle: %s' . PHP_EOL,
            $row['SingerId'], $row['AlbumId'], $row['AlbumTitle']);
    }
}

Python

def read_only_transaction(instance_id, database_id):
    """Reads data inside of a read-only transaction.

    Within the read-only transaction, or "snapshot", the application sees
    consistent view of the database at a particular timestamp.
    """
    spanner_client = spanner.Client()
    instance = spanner_client.instance(instance_id)
    database = instance.database(database_id)

    with database.snapshot(multi_use=True) as snapshot:
        # Read using SQL.
        results = snapshot.execute_sql(
            "SELECT SingerId, AlbumId, AlbumTitle FROM Albums"
        )

        print("Results from first read:")
        for row in results:
            print("SingerId: {}, AlbumId: {}, AlbumTitle: {}".format(*row))

        # Perform another read using the `read` method. Even if the data
        # is updated in-between the reads, the snapshot ensures that both
        # return the same data.
        keyset = spanner.KeySet(all_=True)
        results = snapshot.read(
            table="Albums", columns=("SingerId", "AlbumId", "AlbumTitle"), keyset=keyset
        )

        print("Results from second read:")
        for row in results:
            print("SingerId: {}, AlbumId: {}, AlbumTitle: {}".format(*row))

Ruby

# project_id  = "Your Google Cloud project ID"
# instance_id = "Your Spanner instance ID"
# database_id = "Your Spanner database ID"

require "google/cloud/spanner"

spanner = Google::Cloud::Spanner.new project: project_id
client  = spanner.client instance_id, database_id

client.snapshot do |snapshot|
  snapshot.execute("SELECT SingerId, AlbumId, AlbumTitle FROM Albums").rows.each do |row|
    puts "#{row[:AlbumId]} #{row[:AlbumTitle]} #{row[:SingerId]}"
  end

  # Even if changes occur in-between the reads, the transaction ensures that
  # both return the same data.
  snapshot.read("Albums", [:AlbumId, :AlbumTitle, :SingerId]).rows.each do |row|
    puts "#{row[:AlbumId]} #{row[:AlbumTitle]} #{row[:SingerId]}"
  end
end

Sémantique

Cette section décrit la sémantique des transactions en lecture seule.

Transactions en lecture seule d'instantanés

Lorsqu'une transaction en lecture seule s'exécute dans Spanner, elle effectue toutes ses lectures à un seul instant logique. Cela signifie que la transaction en lecture seule et tous les autres lecteurs et auteurs simultanés voient un instantané cohérent de la base de données à ce moment précis.

Ces transactions en lecture seule avec instantané offrent une approche plus simple pour les lectures cohérentes par rapport aux transactions en lecture-écriture avec verrouillage. Voici pourquoi :

Aucun verrou : les transactions en lecture seule n'acquièrent pas de verrous. Au lieu de cela, elles fonctionnent en sélectionnant un code temporel Spanner et en exécutant toutes les lectures par rapport à cette version historique des données. Comme elles n'utilisent pas de verrous, elles ne bloquent pas les transactions en lecture/écriture simultanées.
Aucune annulation : ces transactions ne sont jamais annulées. Bien qu'elles puissent échouer si leur timestamp de lecture choisi est collecté par le garbage collector, la règle de collecte des déchets par défaut de Spanner est généralement suffisamment généreuse pour que la plupart des applications ne rencontrent pas ce problème.
Aucun commit ni rollback : les transactions en lecture seule ne nécessitent pas d'appels à sessions.commit ni à sessions.rollback, et sont même empêchées de le faire.

Pour exécuter une transaction d'instantané, le client définit une limite d'horodatage qui indique à Spanner comment sélectionner un horodatage de lecture. Voici les types de limites d'horodatage :

Lectures fortes : ces lectures garantissent que vous verrez les effets de toutes les transactions validées avant le début de la lecture. Toutes les lignes d'une même lecture sont cohérentes. Toutefois, les lectures fortes ne sont pas reproductibles, même si elles renvoient un code temporel. La lecture à ce même code temporel est reproductible. Deux transactions en lecture seule fortes consécutives peuvent produire des résultats différents en raison d'écritures simultanées. Les requêtes sur les flux de modifications doivent utiliser cette limite. Pour en savoir plus, consultez TransactionOptions.ReadOnly.strong.
Obsolescence exacte : cette option exécute les lectures à un code temporel que vous spécifiez, soit sous la forme d'un code temporel absolu, soit sous la forme d'une durée d'obsolescence par rapport à l'heure actuelle. Il vous permet d'observer un préfixe cohérent de l'historique des transactions globales jusqu'à cet horodatage et bloque les transactions simultanées qui pourraient être validées avec un horodatage inférieur ou égal à l'horodatage de lecture. Bien qu'il soit légèrement plus rapide que les modes d'obsolescence limitée, il peut renvoyer des données plus anciennes. Pour en savoir plus, consultez TransactionOptions.ReadOnly.read_timestamp et TransactionOptions.ReadOnly.exact_staleness.
Obsolescence limitée : Spanner sélectionne l'horodatage le plus récent dans une limite d'obsolescence définie par l'utilisateur, ce qui permet l'exécution sur l'instance répliquée disponible la plus proche sans blocage. Toutes les lignes renvoyées sont cohérentes. Comme les lectures fortes, l'obsolescence limitée n'est pas reproductible, car différentes lectures peuvent s'exécuter à des horodatages différents, même avec la même limite. Ces lectures fonctionnent en deux phases (négociation de l'horodatage, puis lecture). Elles sont généralement légèrement plus lentes que les lectures à obsolescence exacte, mais elles renvoient souvent des résultats plus récents et sont plus susceptibles d'être exécutées sur un réplica local. Ce mode n'est disponible que pour les transactions en lecture seule à usage unique, car la négociation de l'horodatage nécessite de savoir à l'avance quelles lignes seront lues. Pour en savoir plus, consultez TransactionOptions.ReadOnly.max_staleness et TransactionOptions.ReadOnly.min_read_timestamp.

Transactions à LMD partitionné

Vous pouvez utiliser le LMD partitionné pour exécuter des instructions UPDATE et DELETE à grande échelle sans vous heurter à des limites de transaction ni verrouiller une table entière. Pour ce faire, Spanner partitionne l'espace clé et exécute les instructions LMD sur chaque partition dans une transaction en lecture-écriture distincte.

Pour utiliser le LMD non partitionné, vous exécutez des instructions dans des transactions en lecture-écriture que vous créez explicitement dans votre code. Pour en savoir plus, consultez Utiliser LMD.

Interface

Spanner fournit l'interface TransactionOptions.partitionedDml pour exécuter une seule instruction LMD partitionné.

Exemples

L'exemple de code suivant met à jour la colonne MarketingBudget de la table Albums.

C++

Vous utilisez la fonction ExecutePartitionedDml() pour exécuter une instruction LMD partitionnée.

void DmlPartitionedUpdate(google::cloud::spanner::Client client) {
  namespace spanner = ::google::cloud::spanner;
  auto result = client.ExecutePartitionedDml(
      spanner::SqlStatement("UPDATE Albums SET MarketingBudget = 100000"
                            "  WHERE SingerId > 1"));
  if (!result) throw std::move(result).status();
  std::cout << "Updated at least " << result->row_count_lower_bound
            << " row(s) [spanner_dml_partitioned_update]\n";
}

C#

Utilisez la méthode ExecutePartitionedUpdateAsync() pour exécuter une instruction LMD partitionné.


using Google.Cloud.Spanner.Data;
using System;
using System.Threading.Tasks;

public class UpdateUsingPartitionedDmlCoreAsyncSample
{
    public async Task<long> UpdateUsingPartitionedDmlCoreAsync(string projectId, string instanceId, string databaseId)
    {
        string connectionString = $"Data Source=projects/{projectId}/instances/{instanceId}/databases/{databaseId}";

        using var connection = new SpannerConnection(connectionString);
        await connection.OpenAsync();

        using var cmd = connection.CreateDmlCommand("UPDATE Albums SET MarketingBudget = 100000 WHERE SingerId > 1");
        long rowCount = await cmd.ExecutePartitionedUpdateAsync();

        Console.WriteLine($"{rowCount} row(s) updated...");
        return rowCount;
    }
}

Go

Utilisez la méthode PartitionedUpdate() pour exécuter une instruction LMD partitionné.


import (
	"context"
	"fmt"
	"io"

	"cloud.google.com/go/spanner"
)

func updateUsingPartitionedDML(w io.Writer, db string) error {
	ctx := context.Background()
	client, err := spanner.NewClient(ctx, db)
	if err != nil {
		return err
	}
	defer client.Close()

	stmt := spanner.Statement{SQL: "UPDATE Albums SET MarketingBudget = 100000 WHERE SingerId > 1"}
	rowCount, err := client.PartitionedUpdate(ctx, stmt)
	if err != nil {
		return err
	}
	fmt.Fprintf(w, "%d record(s) updated.\n", rowCount)
	return nil
}

Java

Utilisez la méthode executePartitionedUpdate() pour exécuter une instruction LMD partitionné.

static void updateUsingPartitionedDml(DatabaseClient dbClient) {
  String sql = "UPDATE Albums SET MarketingBudget = 100000 WHERE SingerId > 1";
  long rowCount = dbClient.executePartitionedUpdate(Statement.of(sql));
  System.out.printf("%d records updated.\n", rowCount);
}

Node.js

Utilisez la méthode runPartitionedUpdate() pour exécuter une instruction LMD partitionné.

// Imports the Google Cloud client library
const {Spanner} = require('@google-cloud/spanner');

/**
 * TODO(developer): Uncomment the following lines before running the sample.
 */
// const projectId = 'my-project-id';
// const instanceId = 'my-instance';
// const databaseId = 'my-database';

// Creates a client
const spanner = new Spanner({
  projectId: projectId,
});

// Gets a reference to a Cloud Spanner instance and database
const instance = spanner.instance(instanceId);
const database = instance.database(databaseId);

try {
  const [rowCount] = await database.runPartitionedUpdate({
    sql: 'UPDATE Albums SET MarketingBudget = 100000 WHERE SingerId > 1',
  });
  console.log(`Successfully updated ${rowCount} records.`);
} catch (err) {
  console.error('ERROR:', err);
} finally {
  // Close the database when finished.
  database.close();
}

PHP

Utilisez la méthode executePartitionedUpdate() pour exécuter une instruction LMD partitionné.

use Google\Cloud\Spanner\SpannerClient;

/**
 * Updates sample data in the database by partition with a DML statement.
 *
 * This updates the `MarketingBudget` column which must be created before
 * running this sample. You can add the column by running the `add_column`
 * sample or by running this DDL statement against your database:
 *
 *     ALTER TABLE Albums ADD COLUMN MarketingBudget INT64
 *
 * Example:
 * ```
 * update_data($instanceId, $databaseId);
 * ```
 *
 * @param string $instanceId The Spanner instance ID.
 * @param string $databaseId The Spanner database ID.
 */
function update_data_with_partitioned_dml(string $instanceId, string $databaseId): void
{
    $spanner = new SpannerClient();
    $instance = $spanner->instance($instanceId);
    $database = $instance->database($databaseId);

    $rowCount = $database->executePartitionedUpdate(
        'UPDATE Albums SET MarketingBudget = 100000 WHERE SingerId > 1'
    );

    printf('Updated %d row(s).' . PHP_EOL, $rowCount);
}

Python

Utilisez la méthode execute_partitioned_dml() pour exécuter une instruction LMD partitionné.

# instance_id = "your-spanner-instance"
# database_id = "your-spanner-db-id"

spanner_client = spanner.Client()
instance = spanner_client.instance(instance_id)
database = instance.database(database_id)

row_ct = database.execute_partitioned_dml(
    "UPDATE Albums SET MarketingBudget = 100000 WHERE SingerId > 1"
)

print("{} records updated.".format(row_ct))

Ruby

Utilisez la méthode execute_partitioned_update() pour exécuter une instruction LMD partitionné.

# project_id  = "Your Google Cloud project ID"
# instance_id = "Your Spanner instance ID"
# database_id = "Your Spanner database ID"

require "google/cloud/spanner"

spanner = Google::Cloud::Spanner.new project: project_id
client  = spanner.client instance_id, database_id

row_count = client.execute_partition_update(
  "UPDATE Albums SET MarketingBudget = 100000 WHERE SingerId > 1"
)

puts "#{row_count} records updated."

L'exemple de code suivant supprime les lignes de la table Singers, en fonction de la colonne SingerId.

C++

void DmlPartitionedDelete(google::cloud::spanner::Client client) {
  namespace spanner = ::google::cloud::spanner;
  auto result = client.ExecutePartitionedDml(
      spanner::SqlStatement("DELETE FROM Singers WHERE SingerId > 10"));
  if (!result) throw std::move(result).status();
  std::cout << "Deleted at least " << result->row_count_lower_bound
            << " row(s) [spanner_dml_partitioned_delete]\n";
}

C#


using Google.Cloud.Spanner.Data;
using System;
using System.Threading.Tasks;

public class DeleteUsingPartitionedDmlCoreAsyncSample
{
    public async Task<long> DeleteUsingPartitionedDmlCoreAsync(string projectId, string instanceId, string databaseId)
    {
        string connectionString = $"Data Source=projects/{projectId}/instances/{instanceId}/databases/{databaseId}";

        using var connection = new SpannerConnection(connectionString);
        await connection.OpenAsync();

        using var cmd = connection.CreateDmlCommand("DELETE FROM Singers WHERE SingerId > 10");
        long rowCount = await cmd.ExecutePartitionedUpdateAsync();

        Console.WriteLine($"{rowCount} row(s) deleted...");
        return rowCount;
    }
}

Go


import (
	"context"
	"fmt"
	"io"

	"cloud.google.com/go/spanner"
)

func deleteUsingPartitionedDML(w io.Writer, db string) error {
	ctx := context.Background()
	client, err := spanner.NewClient(ctx, db)
	if err != nil {
		return err
	}
	defer client.Close()

	stmt := spanner.Statement{SQL: "DELETE FROM Singers WHERE SingerId > 10"}
	rowCount, err := client.PartitionedUpdate(ctx, stmt)
	if err != nil {
		return err

	}
	fmt.Fprintf(w, "%d record(s) deleted.", rowCount)
	return nil
}

Java

static void deleteUsingPartitionedDml(DatabaseClient dbClient) {
  String sql = "DELETE FROM Singers WHERE SingerId > 10";
  long rowCount = dbClient.executePartitionedUpdate(Statement.of(sql));
  System.out.printf("%d records deleted.\n", rowCount);
}

Node.js

// Imports the Google Cloud client library
const {Spanner} = require('@google-cloud/spanner');

/**
 * TODO(developer): Uncomment the following lines before running the sample.
 */
// const projectId = 'my-project-id';
// const instanceId = 'my-instance';
// const databaseId = 'my-database';

// Creates a client
const spanner = new Spanner({
  projectId: projectId,
});

// Gets a reference to a Cloud Spanner instance and database
const instance = spanner.instance(instanceId);
const database = instance.database(databaseId);

try {
  const [rowCount] = await database.runPartitionedUpdate({
    sql: 'DELETE FROM Singers WHERE SingerId > 10',
  });
  console.log(`Successfully deleted ${rowCount} records.`);
} catch (err) {
  console.error('ERROR:', err);
} finally {
  // Close the database when finished.
  database.close();
}

PHP

use Google\Cloud\Spanner\SpannerClient;

/**
 * Delete sample data in the database by partition with a DML statement.
 *
 * This updates the `MarketingBudget` column which must be created before
 * running this sample. You can add the column by running the `add_column`
 * sample or by running this DDL statement against your database:
 *
 *     ALTER TABLE Albums ADD COLUMN MarketingBudget INT64
 *
 * Example:
 * ```
 * update_data($instanceId, $databaseId);
 * ```
 *
 * @param string $instanceId The Spanner instance ID.
 * @param string $databaseId The Spanner database ID.
 */
function delete_data_with_partitioned_dml(string $instanceId, string $databaseId): void
{
    $spanner = new SpannerClient();
    $instance = $spanner->instance($instanceId);
    $database = $instance->database($databaseId);

    $rowCount = $database->executePartitionedUpdate(
        'DELETE FROM Singers WHERE SingerId > 10'
    );

    printf('Deleted %d row(s).' . PHP_EOL, $rowCount);
}

Python

# instance_id = "your-spanner-instance"
# database_id = "your-spanner-db-id"
spanner_client = spanner.Client()
instance = spanner_client.instance(instance_id)
database = instance.database(database_id)

row_ct = database.execute_partitioned_dml("DELETE FROM Singers WHERE SingerId > 10")

print("{} record(s) deleted.".format(row_ct))

Ruby

# project_id  = "Your Google Cloud project ID"
# instance_id = "Your Spanner instance ID"
# database_id = "Your Spanner database ID"

require "google/cloud/spanner"

spanner = Google::Cloud::Spanner.new project: project_id
client  = spanner.client instance_id, database_id

row_count = client.execute_partition_update(
  "DELETE FROM Singers WHERE SingerId > 10"
)

puts "#{row_count} records deleted."

Sémantique

Cette section décrit la sémantique du LMD partitionné.

Comprendre l'exécution du LMD partitionné

Vous ne pouvez exécuter qu'une seule instruction LMD partitionné à la fois, que vous utilisiez une méthode de bibliothèque cliente ou Google Cloud CLI.

Les transactions partitionnées ne sont pas compatibles avec les commits ni les restaurations. Spanner exécute et applique immédiatement l'instruction LMD. Si vous annulez l'opération ou si elle échoue, Spanner annule toutes les partitions en cours d'exécution et ne démarre aucune des partitions restantes. Toutefois, Spanner ne restaure pas les partitions déjà exécutées.

Stratégie d'acquisition de verrous pour le LMD partitionné

Pour réduire les conflits de verrouillage, le LMD partitionné n'acquiert de verrous en lecture que sur les lignes correspondant à la clause WHERE. Les transactions indépendantes plus petites utilisées pour chaque partition conservent également les verrous moins longtemps.

Limites de transaction par session

Chaque session dans Spanner ne peut avoir qu'une seule transaction active à la fois. Cela inclut les lectures et les requêtes autonomes, qui utilisent en interne une transaction et sont comptabilisées dans cette limite. Une fois une transaction terminée, la session peut être immédiatement réutilisée pour la transaction suivante. Il n'est pas nécessaire de créer une session pour chaque transaction.

Anciens codes temporels de lecture et récupération de mémoire des versions

Spanner effectue une récupération de mémoire pour collecter les données supprimées ou écrasées et récupérer de l'espace de stockage. Par défaut, les données de plus d'une heure sont récupérées. Spanner ne peut pas effectuer de lectures à des horodatages antérieurs à la VERSION_RETENTION_PERIOD configurée, qui est d'une heure par défaut, mais qui peut être configurée jusqu'à une semaine. Lorsque les lectures deviennent trop anciennes pendant l'exécution, elles échouent et renvoient l'erreur FAILED_PRECONDITION.

Requêtes sur les flux de modifications

Un flux de modifications est un objet de schéma que vous pouvez configurer pour surveiller les modifications de données dans une base de données entière, dans des tables spécifiques ou dans un ensemble défini de colonnes d'une base de données.

Lorsque vous créez un flux de modifications, Spanner définit une fonction de valeur de table (TVF) SQL correspondante. Vous pouvez utiliser cette TVF pour interroger les enregistrements de modifications dans le flux de modifications associé avec la méthode sessions.executeStreamingSql. Le nom de la TVF est généré à partir du nom du flux de modifications et commence toujours par READ_.

Toutes les requêtes sur les TVF de flux de modifications doivent être exécutées à l'aide de l'API sessions.executeStreamingSql dans une transaction en lecture seule à usage unique avec un timestamp_bound en lecture seule fort. Le TVF de flux de modifications vous permet de spécifier start_timestamp et end_timestamp pour la période. Tous les enregistrements de modifications au cours de la période de conservation sont accessibles à l'aide de ce timestamp_bound en lecture seule. Tous les autres TransactionOptions ne sont pas valides pour les requêtes de flux de modifications.

De plus, si TransactionOptions.read_only.return_read_timestamp est défini sur true, le message Transaction décrivant la transaction renvoie une valeur spéciale de 2^63 - 2 au lieu d'un code temporel de lecture valide. Vous devez ignorer cette valeur spéciale et ne pas l'utiliser pour les requêtes ultérieures.

Pour en savoir plus, consultez Workflow de requête des flux de modifications.

Transactions inactives

Une transaction est considérée comme inactive si elle n'a pas de lectures ni de requêtes SQL en attente, et si elle n'en a pas démarré au cours des 10 dernières secondes. Spanner peut abandonner les transactions inactives pour les empêcher de conserver des verrous indéfiniment. Si une transaction inactive est abandonnée, le commit échoue et renvoie une erreur ABORTED. L'exécution périodique d'une petite requête, telle que SELECT 1, dans la transaction peut l'empêcher de devenir inactive.