Ich bin vor ein paar Tagen bei der Programmierung von PyCRMan fast verzweifelt. Wie ich schon in einem früheren Eintrag beschrieb, verwende ich Elixir als Wrapper für die Datenbank und mir ist aufgefallen, das Elixir bei meinen Model sehr viele DB-Queries generiert. Die Anzahl der Queries ist so hoch das die Netzwerk Latenzzeiten eine sehr große Rolle spielen
Nach ewig langen erfolglosem Studieren der etwas dürftigen Elixir Dokumentation bin ich nachts um ca. 1 Uhr in der SQLAlchemy Dokumentation fündig geworden. Die “geheimen” Zauberwörter heißen “lazyload” und “eagerload”, wenn ich das nur vorher schon gewußt hätte
Hier ein kleines Beispiel:
Als erstes mal ein kleines Model (ja das ist das Beispiel aus der Elixir Doku
)
from elixir import * metadata.bind = "sqlite:///:memory:" metadata.bind.echo = True class Movie(Entity): title = Field(String(30)) director = ManyToOne('Director') def __repr__(self): return '<Movie "%s">' % (self.title) class Director(Entity): name = Field(String(60)) movies = OneToMany('Movie') def __repr__(self): return '<Director "%s">' % self.name setup_all() create_all()
Jetzt ein paar Werte einfügen:
rscott = Director(name="Ridley Scott") glucas = Director(name="George Lucas") unknown = Director(name="Nobody Unknown") alien = Movie(title="Alien", director=rscott) swars = Movie(title="Star Wars", director=glucas) brunner = Movie(title="No Name", director=unknown) session.flush() session.clear() for m in Movie.query.all(): print "Movie: name=%s director=%s" % (m.title, m.director.name)
Wenn man nun auf die letzten sql queries schaut, sieht man das erst alle movies aus der DB geladen werden und dann für jeden einzelnen Film wird der Director einzeln geholt. Ha nun ist klar warum das alles so langsam geht
SELECT __main___movie.id AS __main___movie_id, __main___movie.title AS __main___movie_title, __main___movie.director_id AS __main___movie_director_id FROM __main___movie ORDER BY __main___movie.oid [] SELECT __main___director.id AS __main___director_id, __main___director.name AS __main___director_name FROM __main___director WHERE __main___director.id = ? [1] SELECT __main___director.id AS __main___director_id, __main___director.name AS __main___director_name FROM __main___director WHERE __main___director.id = ? [2] SELECT __main___director.id AS __main___director_id, __main___director.name AS __main___director_name FROM __main___director WHERE __main___director.id = ? [3]
Damit aus diesen beispielhaften 4 Queries EINE wird kann man an so einer Stelle eagerload verwenden.
# import eagerload from sqlalchemy from sqlalchemy.orm import eagerload for m in Movie.query.options(eagerload("director")).all(): print "Movie: name=%s director=%s" % (m.title, m.director.name)
Und schon ist es eine Query:
SELECT __main___movie.id AS __main___movie_id, __main___movie.title AS __main___movie_title, __main___movie.director_id AS __main___movie_director_id, __main___director_1.id AS __main___director_1_id, __main___director_1.name AS __main___director_1_name FROM __main___movie LEFT OUTER JOIN __main___director AS __main___director_1 ON __main___movie.director_id = __main___director_1.id ORDER BY __main___movie.oid, __main___director_1.oid
Alternativ zum “eagerload” kann man auch im Model das lazyload abschalten.
class Movie(Entity): title = Field(String(30)) director = ManyToOne('Director', lazy=False) # <- lazyload now False def __repr__(self): return '<Movie "%s">' % (self.title)
Und wenn man mal das ganze Gegenteil braucht, kann man lazyload verwenden und im Model heißt die Option “deferred=True”.
posted with Vim