查詢操做 -- Django從入門到精通系列教程

該系列教程系我的原創,並完整發布在我的官網劉江的博客和教程

全部轉載本文者,需在頂部顯著位置註明原做者及www.liujiangblog.com官網地址。


查詢操做是Django的ORM框架中最重要的內容之一。咱們創建模型、保存數據爲的就是在須要的時候能夠查詢獲得數據。Django自動爲全部的模型提供了一套完善、方便、高效的API,一些重要的,咱們要背下來,一些不經常使用的,要有印象,使用的時候能夠快速查找參考手冊。python


本節的內容基於以下的一個博客應用模型:web

from django.db import models

class Blog(models.Model):
    name = models.CharField(max_length=100)
    tagline = models.TextField()

    def __str__(self):              # __unicode__ on Python 2
        return self.name

class Author(models.Model):
    name = models.CharField(max_length=200)
    email = models.EmailField()

    def __str__(self):              # __unicode__ on Python 2
        return self.name

class Entry(models.Model):
    blog = models.ForeignKey(Blog, on_delete=models.CASCADE)
    headline = models.CharField(max_length=255)
    body_text = models.TextField()
    pub_date = models.DateField()
    mod_date = models.DateField()
    authors = models.ManyToManyField(Author)
    n_comments = models.IntegerField()
    n_pingbacks = models.IntegerField()
    rating = models.IntegerField()

    def __str__(self):              # __unicode__ on Python 2
        return self.headline

1、建立對象

假設模型位於mysite/blog/models.py文件中,那麼建立對象的方式以下:sql

>>> from blog.models import Blog
>>> b = Blog(name='Beatles Blog', tagline='All the latest Beatles news.')
>>> b.save()

在後臺,這會運行一條SQL的INSERT語句。若是你不顯式地調用save()方法,Django不會馬上將該操做反映到數據庫中。save()方法沒有返回值,它能夠接受一些額外的參數。數據庫

若是想要一行代碼完成上面的操做,請使用creat()方法,它能夠省略save的步驟:django

b = Blog.objects.create(name='Beatles Blog', tagline='All the latest Beatles news.')

2、保存對象

使用save()方法,保存對數據庫內已有對象的修改。例如若是已經存在b5對象在數據庫內:編程

>>> b5.name = 'New name'
>>> b5.save()

在後臺,這會運行一條SQL的UPDATE語句。若是你不顯式地調用save()方法,Django不會馬上將該操做反映到數據庫中。緩存

1. 保存外鍵和多對多字段

保存一個外鍵字段和保存普通字段沒什麼區別,只是要注意值的類型要正確。下面的例子,有一個Entry的實例entry和一個Blog的實例cheese_blog,而後把cheese_blog做爲值賦給了entry的blog屬性,最後調用save方法進行保存。安全

>>> from blog.models import Entry
>>> entry = Entry.objects.get(pk=1)
>>> cheese_blog = Blog.objects.get(name="Cheddar Talk")
>>> entry.blog = cheese_blog
>>> entry.save()

多對多字段的保存稍微有點區別,須要調用一個add()方法,而不是直接給屬性賦值,但它不須要調用save方法。以下例所示:app

>>> from blog.models import Author
>>> joe = Author.objects.create(name="Joe")
>>> entry.authors.add(joe)

在一行語句內,能夠同時添加多個對象到多對多的字段,以下所示:框架

>>> john = Author.objects.create(name="John")
>>> paul = Author.objects.create(name="Paul")
>>> george = Author.objects.create(name="George")
>>> ringo = Author.objects.create(name="Ringo")
>>> entry.authors.add(john, paul, george, ringo)

若是你指定或添加了錯誤類型的對象,Django會拋出異常。

3、檢索對象

想要從數據庫內檢索對象,你須要基於模型類,經過管理器(Manager)構造一個查詢結果集(QuerySet)。

每一個QuerySet表明一些數據庫對象的集合。它能夠包含零個、一個或多個過濾器(filters)。Filters縮小查詢結果的範圍。在SQL語法中,一個QuerySet至關於一個SELECT語句,而filter則至關於WHERE或者LIMIT一類的子句。

經過模型的Manager得到QuerySet,每一個模型至少具備一個Manager,默認狀況下,它被稱做objects,能夠經過模型類直接調用它,但不能經過模型類的實例調用它,以此實現「表級別」操做和「記錄級別」操做的強制分離。以下所示:

>>> Blog.objects
<django.db.models.manager.Manager object at ...>
>>> b = Blog(name='Foo', tagline='Bar')
>>> b.objects
Traceback:
...
AttributeError: "Manager isn't accessible via Blog instances."

1. 檢索全部對象

使用all()方法,能夠獲取某張表的全部記錄。

>>> all_entries = Entry.objects.all()

2. 過濾對象

有兩個方法能夠用來過濾QuerySet的結果,分別是:

  • filter(**kwargs):返回一個根據指定參數查詢出來的QuerySet
  • exclude(**kwargs):返回除了根據指定參數查詢出來結果的QuerySet

其中,**kwargs參數的格式必須是Django設置的一些字段格式。

例如:

Entry.objects.filter(pub_date__year=2006)

它等同於:

Entry.objects.all().filter(pub_date__year=2006)

鏈式過濾

filter和exclude的結果依然是個QuerySet,所以它能夠繼續被filter和exclude,這就造成了鏈式過濾:

>>> Entry.objects.filter(
...     headline__startswith='What'
... ).exclude(
...     pub_date__gte=datetime.date.today()
... ).filter(
...     pub_date__gte=datetime(2005, 1, 30)
... )

(這裏須要注意的是,當在進行跨關係的鏈式過濾時,結果可能和你想象的不同,參考下面的跨多值關係查詢)

被過濾的QuerySets都是惟一的

每一次過濾,你都會得到一個全新的QuerySet,它和以前的QuerySet沒有任何關係,能夠徹底獨立的被保存,使用和重用。例如:

>>> q1 = Entry.objects.filter(headline__startswith="What")
>>> q2 = q1.exclude(pub_date__gte=datetime.date.today())
>>> q3 = q1.filter(pub_date__gte=datetime.date.today())

例子中的q2和q3雖然由q1得來,是q1的子集,可是都是獨立自主存在的。一樣q1也不會受到q2和q3的影響。

QuerySets都是懶惰的

一個建立QuerySets的動做不會馬上致使任何的數據庫行爲。你能夠不斷地進行filter動做一成天,Django不會運行任何實際的數據庫查詢動做,直到QuerySets被提交(evaluated)。

簡而言之就是,只有碰到某些特定的操做,Django纔會將全部的操做體現到數據庫內,不然它們只是保存在內存和Django的層面中。這是一種提升數據庫查詢效率,減小操做次數的優化設計。看下面的例子:

>>> q = Entry.objects.filter(headline__startswith="What")
>>> q = q.filter(pub_date__lte=datetime.date.today())
>>> q = q.exclude(body_text__icontains="food")
>>> print(q)

上面的例子,看起來執行了3次數據庫訪問,實際上只是在print語句時才執行1次訪問。一般狀況,QuerySets的檢索不會馬上執行實際的數據庫查詢操做,直到出現相似print的請求,也就是所謂的evaluated。

3. 檢索單一對象

filter方法始終返回的是QuerySets,那怕只有一個對象符合過濾條件,返回的也是包含一個對象的QuerySets,這是一個集合類型對象,你能夠簡單的理解爲Python列表,可迭代可循環可索引。

若是你肯定你的檢索只會得到一個對象,那麼你可使用Manager的get()方法來直接返回這個對象。

>>> one_entry = Entry.objects.get(pk=1)

在get方法中你可使用任何filter方法中的查詢參數,用法也是如出一轍。

注意:使用get()方法和使用filter()方法而後經過[0]的方式分片,有着不一樣的地方。看似二者都是獲取單一對象。可是,若是在查詢時沒有匹配到對象,那麼get()方法將拋出DoesNotExist異常。這個異常是模型類的一個屬性,在上面的例子中,若是不存在主鍵爲1的Entry對象,那麼Django將拋出Entry.DoesNotExist異常。

相似地,在使用get()方法查詢時,若是結果超過1個,則會拋出MultipleObjectsReturned異常,這個異常也是模型類的一個屬性。

因此:get()方法要慎用!

4. 其它QuerySet方法

大多數狀況下,須要從數據庫中查找對象時,使用all()、 get()、filter() 和exclude()就行。針對QuerySet的方法還有不少,都是一些相對高級的用法。

5. QuerySet使用限制

使用相似Python對列表進行切片的方法能夠對QuerySet進行範圍取值。它至關於SQL語句中的LIMIT和OFFSET子句。參考下面的例子:

>>> Entry.objects.all()[:5]      # 返回前5個對象
>>> Entry.objects.all()[5:10]    # 返回第6個到第10個對象

注意:不支持負索引!例如 Entry.objects.all()[-1]是不容許的

一般狀況,切片操做會返回一個新的QuerySet,而且不會被馬上執行。可是有一個例外,那就是指定步長的時候,查詢操做會馬上在數據庫內執行,以下:

>>> Entry.objects.all()[:10:2]

若要獲取單一的對象而不是一個列表(例如,SELECT foo FROM bar LIMIT 1),能夠簡單地使用索引而不是切片。例如,下面的語句返回數據庫中根據標題排序後的第一條Entry:

>>> Entry.objects.order_by('headline')[0]

它至關於:

>>> Entry.objects.order_by('headline')[0:1].get()

注意:若是沒有匹配到對象,那麼第一種方法會拋出IndexError異常,而第二種方式會拋出DoesNotExist異常。

也就是說在使用get和切片的時候,要注意查詢結果的元素個數。

6. 字段查詢

字段查詢其實就是filter()、exclude()和get()等方法的關鍵字參數。
其基本格式是:field__lookuptype=value注意其中是雙下劃線
例如:

>>> Entry.objects.filter(pub_date__lte='2006-01-01')
# 至關於:
SELECT * FROM blog_entry WHERE pub_date <= '2006-01-01';

其中的字段必須是模型中定義的字段之一。可是有一個例外,那就是ForeignKey字段,你能夠爲其添加一個「_id」後綴(單下劃線)。這種狀況下鍵值是外鍵模型的主鍵原生值。例如:

>>> Entry.objects.filter(blog_id=4)

若是你傳遞了一個非法的鍵值,查詢函數會拋出TypeError異常。

Django的數據庫API支持20多種查詢類型,下面介紹一些經常使用的:

exact:

默認類型。若是你不提供查詢類型,或者關鍵字參數不包含一個雙下劃線,那麼查詢類型就是這個默認的exact。

>>> Entry.objects.get(headline__exact="Cat bites dog")
# 至關於
# SELECT ... WHERE headline = 'Cat bites dog';
# 下面兩個至關
>>> Blog.objects.get(id__exact=14)  # Explicit form
>>> Blog.objects.get(id=14)         # __exact is implied

iexact:

不區分大小寫。

>>> Blog.objects.get(name__iexact="beatles blog")
# 匹配"Beatles Blog", "beatles blog",甚至"BeAtlES blOG".

contains:

表示包含的意思!大小寫敏感!

Entry.objects.get(headline__contains='Lennon')
# 至關於
# SELECT ... WHERE headline LIKE '%Lennon%';
# 匹配'Today Lennon honored',但不匹配'today lennon honored'

icontains:

contains的大小寫不敏感模式。

startswith和endswith

以什麼開頭和以什麼結尾。大小寫敏感!

istartswith和iendswith

是不區分大小寫的模式。

7. 跨越關係查詢

Django提供了強大而且直觀的方式解決跨越關聯的查詢,它在後臺自動執行包含JOIN的SQL語句。要跨越某個關聯,只需使用關聯的模型字段名稱,並使用雙下劃線分隔,直至你想要的字段(能夠鏈式跨越,無限跨度)。例如:

# 返回全部Blog的name爲'Beatles Blog'的Entry對象
# 必定要注意,返回的是Entry對象,而不是Blog對象。
# objects前面用的是哪一個class,返回的就是哪一個class的對象。
>>> Entry.objects.filter(blog__name='Beatles Blog')

反之亦然,若是要引用一個反向關聯,只須要使用模型的小寫名!

# 獲取全部的Blog對象,前提是它所關聯的Entry的headline包含'Lennon'
>>> Blog.objects.filter(entry__headline__contains='Lennon')

若是你在多級關聯中進行過濾並且其中某個中間模型沒有知足過濾條件的值,Django將把它當作一個空的(全部的值都爲NULL)可是合法的對象,不會拋出任何異常或錯誤。例如,在下面的過濾器中:

Blog.objects.filter(entry__authors__name='Lennon')

若是Entry中沒有關聯任何的author,那麼它將看成其沒有name,而不會由於沒有author 引起一個錯誤。一般,這是比較符合邏輯的處理方式。惟一可能讓你困惑的是當你使用isnull的時候:

Blog.objects.filter(entry__authors__name__isnull=True)

這將返回Blog對象,它關聯的entry對象的author字段的name字段爲空,以及Entry對象的author字段爲空。若是你不須要後者,你能夠這樣寫:

Blog.objects.filter(entry__authors__isnull=False,entry__authors__name__isnull=True)

跨越多值的關係查詢

最基本的filter和exclude的關鍵字參數只有一個,這種狀況很好理解。可是當關鍵字參數有多個,且是跨越外鍵或者多對多的狀況下,那麼就比較複雜,讓人迷惑了。咱們看下面的例子:

Blog.objects.filter(entry__headline__contains='Lennon', entry__pub_date__year=2008)

這是一個跨外鍵、兩個過濾參數的查詢。此時咱們理解兩個參數之間屬於-與「and」的關係,也就是說,過濾出來的BLog對象對應的entry對象必須同時知足上面兩個條件。這點很好理解。也就是說上面要求至少有一個entry同時知足兩個條件

可是,看下面的用法:

Blog.objects.filter(entry__headline__contains='Lennon').filter(entry__pub_date__year=2008)

把兩個參數拆開,放在兩個filter調用裏面,按照咱們前面說過的鏈式過濾,這個結果應該和上面的例子同樣。可實際上,它不同,Django在這種狀況下,將兩個filter之間的關係設計爲-或「or」,這真是讓人頭疼。

多對多關係下的多值查詢和外鍵foreignkey的狀況同樣。

可是,更頭疼的來了,exclude的策略設計的又和filter不同!

Blog.objects.exclude(entry__headline__contains='Lennon',entry__pub_date__year=2008,)

這會排除headline中包含「Lennon」的Entry和在2008年發佈的Entry,中間是一個-和「or」的關係!

那麼要排除同時知足上面兩個條件的對象,該怎麼辦呢?看下面:

Blog.objects.exclude(
entry=Entry.objects.filter(
    headline__contains='Lennon',
    pub_date__year=2008,
),
)

(有沒有很坑爹的感受?因此,建議在碰到跨關係的多值查詢時,儘可能使用Q查詢)

8. 使用F表達式引用模型的字段

到目前爲止的例子中,咱們都是將模型字段與常量進行比較。可是,若是你想將模型的一個字段與同一個模型的另一個字段進行比較該怎麼辦?

使用Django提供的F表達式!

例如,爲了查找comments數目多於pingbacks數目的Entry,能夠構造一個F()對象來引用pingback數目,並在查詢中使用該F()對象:

>>> from django.db.models import F
>>> Entry.objects.filter(n_comments__gt=F('n_pingbacks'))

Django支持對F()對象進行加、減、乘、除、取模以及冪運算等算術操做。兩個操做數能夠是常數和其它F()對象。例如查找comments數目比pingbacks兩倍還要多的Entry,咱們能夠這麼寫:

>>> Entry.objects.filter(n_comments__gt=F('n_pingbacks') * 2)

爲了查詢rating比pingback和comment數目總和要小的Entry,咱們能夠這麼寫:

>>> Entry.objects.filter(rating__lt=F('n_comments') + F('n_pingbacks'))

你還能夠在F()中使用雙下劃線來進行跨表查詢。例如,查詢author的名字與blog名字相同的Entry:

>>> Entry.objects.filter(authors__name=F('blog__name'))

對於date和date/time字段,還能夠加或減去一個timedelta對象。下面的例子將返回發佈時間超過3天后被修改的全部Entry:

>>> from datetime import timedelta
>>> Entry.objects.filter(mod_date__gt=F('pub_date') + timedelta(days=3))

F()對象還支持.bitand().bitor().bitrightshift().bitleftshift()4種位操做,例如:

>>> F('somefield').bitand(16)

9. 主鍵的快捷查詢方式:pk

pk就是primary key的縮寫。一般狀況下,一個模型的主鍵爲「id」,因此下面三個語句的效果同樣:

>>> Blog.objects.get(id__exact=14) # Explicit form
>>> Blog.objects.get(id=14) # __exact is implied
>>> Blog.objects.get(pk=14) # pk implies id__exact

能夠聯合其餘類型的參數:

# Get blogs entries with id 1, 4 and 7
>>> Blog.objects.filter(pk__in=[1,4,7])
# Get all blog entries with id > 14
>>> Blog.objects.filter(pk__gt=14)

能夠跨表操做:

>>> Entry.objects.filter(blog__id__exact=3) 
>>> Entry.objects.filter(blog__id=3) 
>>> Entry.objects.filter(blog__pk=3)

當主鍵不是id的時候,請注意了!

10. 在LIKE語句中轉義百分符號和下劃線

在原生SQL語句中%符號有特殊的做用。Django幫你自動轉義了百分符號和下劃線,你能夠和普通字符同樣使用它們,以下所示:

>>> Entry.objects.filter(headline__contains='%')
# 它和下面的同樣
# SELECT ... WHERE headline LIKE '%\%%';

11. 緩存與查詢集

每一個QuerySet都包含一個緩存,用於減小對數據庫的實際操做。理解這個概念,有助於你提升查詢效率。

對於新建立的QuerySet,它的緩存是空的。當QuerySet第一次被提交後,數據庫執行實際的查詢操做,Django會把查詢的結果保存在QuerySet的緩存內,隨後的對於該QuerySet的提交將重用這個緩存的數據。

要想高效的利用查詢結果,下降數據庫負載,你必須善於利用緩存。看下面的例子,這會形成2次實際的數據庫操做,加倍數據庫的負載,同時因爲時間差的問題,可能在兩次操做之間數據被刪除或修改或添加,致使髒數據的問題:

>>> print([e.headline for e in Entry.objects.all()])
>>> print([e.pub_date for e in Entry.objects.all()])

爲了不上面的問題,好的使用方式以下,這隻產生一次實際的查詢操做,而且保持了數據的一致性:

>>> queryset = Entry.objects.all()
>>> print([p.headline for p in queryset]) # 提交查詢
>>> print([p.pub_date for p in queryset]) # 重用查詢緩存

什麼時候不會被緩存

有一些操做不會緩存QuerySet,例如切片和索引。這就致使這些操做沒有緩存可用,每次都會執行實際的數據庫查詢操做。例如:

>>> queryset = Entry.objects.all()
>>> print(queryset[5]) # 查詢數據庫
>>> print(queryset[5]) # 再次查詢數據庫

可是,若是已經遍歷過整個QuerySet,那麼就至關於緩存過,後續的操做則會使用緩存,例如:

>>> queryset = Entry.objects.all()
>>> [entry for entry in queryset] # 查詢數據庫
>>> print(queryset[5]) # 使用緩存
>>> print(queryset[5]) # 使用緩存

下面的這些操做都將遍歷QuerySet並創建緩存:

>>> [entry for entry in queryset]
>>> bool(queryset)
>>> entry in queryset
>>> list(queryset)

注意:簡單的打印QuerySet並不會創建緩存,由於__repr__()調用只返回所有查詢集的一個切片。

4、使用Q對象進行復雜查詢

普通filter函數裏的條件都是「and」邏輯,若是你想實現「or」邏輯怎麼辦?用Q查詢!

Q來自django.db.models.Q,用於封裝關鍵字參數的集合,能夠做爲關鍵字參數用於filter、exclude和get等函數。
例如:

from django.db.models import Q
Q(question__startswith='What')

可使用「&」或者「|」或「~」來組合Q對象,分別表示與或非邏輯。它將返回一個新的Q對象。

Q(question__startswith='Who')|Q(question__startswith='What')
# 這至關於:
WHERE question LIKE 'Who%' OR question LIKE 'What%'

更多的例子:

Q(question__startswith='Who') | ~Q(pub_date__year=2005)

你也能夠這麼使用,默認狀況下,以逗號分隔的都表示AND關係:

Poll.objects.get(
Q(question__startswith='Who'),
Q(pub_date=date(2005, 5, 2)) | Q(pub_date=date(2005, 5, 6))
)
# 它至關於
# SELECT * from polls WHERE question LIKE 'Who%'
AND (pub_date = '2005-05-02' OR pub_date = '2005-05-06')

當關鍵字參數和Q對象組合使用時,Q對象必須放在前面,以下例子:

Poll.objects.get(
Q(pub_date=date(2005, 5, 2)) | Q(pub_date=date(2005, 5, 6)),question__startswith='Who',)

若是關鍵字參數放在Q對象的前面,則會報錯。

5、比較對象

要比較兩個模型實例,只須要使用python提供的雙等號比較符就能夠了。在後臺,其實比較的是兩個實例的主鍵的值。下面兩種方法是等同的:

>>> some_entry == other_entry
>>> some_entry.id == other_entry.id

若是模型的主鍵不叫作「id」也不要緊,後臺老是會使用正確的主鍵名字進行比較,例如,若是一個模型的主鍵的名字是「name」,那麼下面是相等的:

>>> some_obj == other_obj
>>> some_obj.name == other_obj.name

6、刪除對象

刪除對象使用的是對象的delete()方法。該方法將返回被刪除對象的總數量和一個字典,字典包含了每種被刪除對象的類型和該類型的數量。以下所示:

>>> e.delete()
(1, {'weblog.Entry': 1})

也能夠批量刪除。每一個QuerySet都有一個delete()方法,它能刪除該QuerySet的全部成員。例如:

>>> Entry.objects.filter(pub_date__year=2005).delete()
(5, {'webapp.Entry': 5})

須要注意的是,有可能不是每個對象的delete方法都被執行。若是你改寫了delete方法,爲了確保對象被刪除,你必須手動迭代QuerySet進行逐一刪除操做。

當Django刪除一個對象時,它默認使用SQL的ON DELETE CASCADE約束,也就是說,任何有外鍵指向要刪除對象的對象將一塊兒被刪除。例如:

b = Blog.objects.get(pk=1)
# 下面的動做將刪除該條Blog和全部的它關聯的Entry對象
b.delete()

這種級聯的行爲能夠經過的ForeignKey的on_delete參數自定義。

注意,delete()是惟一沒有在管理器上暴露出來的方法。這是刻意設計的一個安全機制,用來防止你意外地請求相似Entry.objects.delete()的動做,而不慎刪除了全部的條目。若是你確實想刪除全部的對象,你必須明確地請求一個徹底的查詢集,像下面這樣:

Entry.objects.all().delete()

7、複製模型實例

雖然沒有內置的方法用於複製模型的實例,但仍是很容易建立一個新的實例並將原實例的全部字段都拷貝過來。最簡單的方法是將原實例的pk設置爲None,這會建立一個新的實例copy。示例以下:

blog = Blog(name='My blog', tagline='Blogging is easy')
blog.save() # blog.pk == 1
#
blog.pk = None
blog.save() # blog.pk == 2

可是在使用繼承的時候,狀況會變得複雜,若是有下面一個Blog的子類:

class ThemeBlog(Blog):
    theme = models.CharField(max_length=200)

django_blog = ThemeBlog(name='Django', tagline='Django is easy', theme='python')
django_blog.save() # django_blog.pk == 3

基於繼承的工做機制,你必須同時將pk和id設爲None:

django_blog.pk = None
django_blog.id = None
django_blog.save() # django_blog.pk == 4

對於外鍵和多對多關係,更須要進一步處理。例如,Entry有一個ManyToManyField到Author。 複製條目後,您必須爲新條目設置多對多關係,像下面這樣:

entry = Entry.objects.all()[0] # some previous entry
old_authors = entry.authors.all()
entry.pk = None
entry.save()
entry.authors.set(old_authors)

對於OneToOneField,還要複製相關對象並將其分配給新對象的字段,以免違反一對一惟一約束。 例如,假設entry已經如上所述重複:

detail = EntryDetail.objects.all()[0]
detail.pk = None
detail.entry = entry
detail.save()

8、批量更新對象

使用update()方法能夠批量爲QuerySet中全部的對象進行更新操做。

# 更新全部2007年發佈的entry的headline
Entry.objects.filter(pub_date__year=2007).update(headline='Everything is the same')

只能夠對普通字段和ForeignKey字段使用這個方法。若要更新一個普通字段,只需提供一個新的常數值。若要更新ForeignKey字段,需設置新值爲你想指向的新模型實例。例如:

>>> b = Blog.objects.get(pk=1)
# 修改全部的Entry,讓他們都屬於b
>>> Entry.objects.all().update(blog=b)

update方法會被馬上執行,並返回操做匹配到的行的數目(有可能不等於要更新的行的數量,由於有些行可能已經有這個新值了)。惟一的約束是:只能訪問一張數據庫表。你能夠根據關係字段進行過濾,但你只能更新模型主表的字段。例如:

>>> b = Blog.objects.get(pk=1)
# Update all the headlines belonging to this Blog.
>>> Entry.objects.select_related().filter(blog=b).update(headline='Everything is the same')

要注意的是update()方法會直接轉換成一個SQL語句,並馬上批量執行。它不會運行模型的save()方法,或者產生pre_savepost_save信號(調用save()方法產生)或者服從auto_now字段選項。若是你想保存QuerySet中的每一個條目並確保每一個實例的save()方法都被調用,你不須要使用任何特殊的函數來處理。只須要迭代它們並調用save()方法:

for item in my_queryset:
    item.save()

update方法能夠配合F表達式。這對於批量更新同一模型中某個字段特別有用。例如增長Blog中每一個Entry的pingback個數:

>>> Entry.objects.all().update(n_pingbacks=F('n_pingbacks') + 1)

然而,與filter和exclude子句中的F()對象不一樣,在update中你不可使用F()對象進行跨表操做,你只能夠引用正在更新的模型的字段。若是你嘗試使用F()對象引入另一張表的字段,將拋出FieldError異常:

# THIS WILL RAISE A FieldError
>>> Entry.objects.update(headline=F('blog__name'))

9、關係的對象

利用本節一開始的模型,一個Entry對象e能夠經過blog屬性e.blog獲取關聯的Blog對象。反過來,Blog對象b能夠經過entry_set屬性b.entry_set.all()訪問與它關聯的全部Entry對象。

1. 一對多(外鍵)

正向查詢:

直接經過圓點加屬性,訪問外鍵對象:

>>> e = Entry.objects.get(id=2)
>>> e.blog # 返回關聯的Blog對象

要注意的是,對外鍵的修改,必須調用save方法進行保存,例如:

>>> e = Entry.objects.get(id=2)
>>> e.blog = some_blog
>>> e.save()

若是一個外鍵字段設置有null=True屬性,那麼能夠經過給該字段賦值爲None的方法移除外鍵值:

>>> e = Entry.objects.get(id=2)
>>> e.blog = None
>>> e.save() # "UPDATE blog_entry SET blog_id = NULL ...;"

在第一次對一個外鍵關係進行正向訪問的時候,關係對象會被緩存。隨後對一樣外鍵關係對象的訪問會使用這個緩存,例如:

>>> e = Entry.objects.get(id=2)
>>> print(e.blog)  # 訪問數據庫,獲取實際數據
>>> print(e.blog)  # 不會訪問數據庫,直接使用緩存的版本

請注意QuerySet的select_related()方法會遞歸地預填充全部的一對多關係到緩存中。例如:

>>> e = Entry.objects.select_related().get(id=2)
>>> print(e.blog)  # 不會訪問數據庫,直接使用緩存
>>> print(e.blog)  # 不會訪問數據庫,直接使用緩存

反向查詢:

若是一個模型有ForeignKey,那麼該ForeignKey所指向的外鍵模型的實例能夠經過一個管理器進行反向查詢,返回源模型的全部實例。默認狀況下,這個管理器的名字爲FOO_set,其中FOO是源模型的小寫名稱。該管理器返回的查詢集能夠用前面提到的方式進行過濾和操做。

>>> b = Blog.objects.get(id=1)
>>> b.entry_set.all() # Returns all Entry objects related to Blog.
# b.entry_set is a Manager that returns QuerySets.
>>> b.entry_set.filter(headline__contains='Lennon')
>>> b.entry_set.count()

你能夠在ForeignKey字段的定義中,經過設置related_name來重寫FOO_set的名字。舉例說明,若是你修改Entry模型blog = ForeignKey(Blog, on_delete=models.CASCADE, related_name=’entries’),那麼上面的例子會變成下面的樣子:

>>> b = Blog.objects.get(id=1)
>>> b.entries.all() # Returns all Entry objects related to Blog.
# b.entries is a Manager that returns QuerySets.
>>> b.entries.filter(headline__contains='Lennon')
>>> b.entries.count()

使用自定義的反向管理器:

默認狀況下,用於反向關聯的RelatedManager是該模型默認管理器的子類。若是你想爲一個查詢指定一個不一樣的管理器,你可使用下面的語法:

from django.db import models

class Entry(models.Model):
    #...
    objects = models.Manager()  # 默認管理器
    entries = EntryManager()    # 自定義管理器

b = Blog.objects.get(id=1)
b.entry_set(manager='entries').all()

固然,指定的自定義反向管理器也能夠調用它的自定義方法:

b.entry_set(manager='entries').is_published()

處理關聯對象的其它方法:

除了在前面定義的QuerySet方法以外,ForeignKey管理器還有其它方法用於處理關聯的對象集合。下面是每一個方法的歸納。

add(obj1, obj2, ...):添加指定的模型對象到關聯的對象集中。

create(**kwargs):建立一個新的對象,將它保存並放在關聯的對象集中。返回新建立的對象。

remove(obj1, obj2, ...):從關聯的對象集中刪除指定的模型對象。

clear():清空關聯的對象集。

set(objs):重置關聯的對象集。

若要一次性給關聯的對象集賦值,使用set()方法,並給它賦值一個可迭代的對象集合或者一個主鍵值的列表。例如:

b = Blog.objects.get(id=1)
b.entry_set.set([e1, e2])

在這個例子中,e1和e2能夠是完整的Entry實例,也能夠是整數的主鍵值。

若是clear()方法可用,那麼在將可迭代對象中的成員添加到集合中以前,將從entry_set中刪除全部已經存在的對象。若是clear()方法不可用,那麼將直接添加可迭代對象中的成員而不會刪除全部已存在的對象。

這節中的每一個反向操做都將當即在數據庫內執行。全部的增長、建立和刪除操做也將馬上自動地保存到數據庫內。

2. 多對多

多對多關係的兩端都會自動得到訪問另外一端的API。這些API的工做方式與前面提到的「反向」一對多關係的用法同樣。

惟一的區別在於屬性的名稱:定義ManyToManyField的模型使用該字段的屬性名稱,而「反向」模型使用源模型的小寫名稱加上'_set' (和一對多關係同樣)。

e = Entry.objects.get(id=3)
e.authors.all() # Returns all Author objects for this Entry.
e.authors.count()
e.authors.filter(name__contains='John')
#
a = Author.objects.get(id=5)
a.entry_set.all() # Returns all Entry objects for this Author.

與外鍵字段中同樣,在多對多的字段中也能夠指定related_name名。

(注:在一個模型中,若是存在多個外鍵或多對多的關係指向同一個外部模型,必須給他們分別加上不一樣的related_name,用於反向查詢)

3. 一對一

一對一很是相似多對一關係,能夠簡單的經過模型的屬性訪問關聯的模型。

class EntryDetail(models.Model):
    entry = models.OneToOneField(Entry, on_delete=models.CASCADE)
    details = models.TextField()

ed = EntryDetail.objects.get(id=2)
ed.entry # Returns the related Entry object.

不一樣之處在於反向查詢的時候。一對一關係中的關聯模型一樣具備一個管理器對象,可是該管理器表示一個單一的對象而不是對象的集合:

e = Entry.objects.get(id=2)
e.entrydetail # 返回關聯的EntryDetail對象

若是沒有對象賦值給這個關係,Django將拋出一個DoesNotExist異常。
能夠給反向關聯進行賦值,方法和正向的關聯同樣:

e.entrydetail = ed

4. 反向關聯是如何實現的?

一些ORM框架須要你在關係的兩端都進行定義。Django的開發者認爲這違反了DRY (Don’t Repeat Yourself)原則,因此在Django中你只須要在一端進行定義。

那麼這是怎麼實現的呢?由於在關聯的模型類沒有被加載以前,一個模型類根本不知道有哪些類和它關聯。

答案在app registry!在Django啓動的時候,它會導入全部INSTALLED_APPS中的應用和每一個應用中的模型模塊。每建立一個新的模型時,Django會自動添加反向的關係到全部關聯的模型。若是關聯的模型尚未導入,Django將保存關聯的記錄並在關聯的模型導入時添加這些關係。

因爲這個緣由,將模型所在的應用都定義在INSTALLED_APPS的應用列表中就顯得特別重要。不然,反向關聯將不能正確工做。

5. 經過關聯對象進行查詢

涉及關聯對象的查詢與正常值的字段查詢遵循一樣的規則。當你指定查詢須要匹配的值時,你可使用一個對象實例或者對象的主鍵值。

例如,若是你有一個id=5的Blog對象b,下面的三個查詢將是徹底同樣的:

Entry.objects.filter(blog=b) # 使用對象實例
Entry.objects.filter(blog=b.id) # 使用實例的id
Entry.objects.filter(blog=5) # 直接使用id

10、使用原生SQL語句

若是你發現須要編寫的Django查詢語句太複雜,你能夠迴歸到手工編寫SQL語句。Django對於編寫原生的SQL查詢有許多選項。

最後,須要注意的是Django的數據庫層只是一個數據庫接口。你能夠利用其它的工具、編程語言或數據庫框架來訪問數據庫,Django沒有強制指定你非要使用它的某個功能或模塊。

相關文章
相關標籤/搜索