写给MongoDB开发者的50条建议Tip23
更新:HHH   时间:2023-1-7


本系列文章翻译自《50 Tips and Tricks for MongoDB Developers》,暂时没有找到中文版,反正自己最近也在深入学习mongodb,所以正好拿来翻译一下。一方面加强自己学习的效果,另一方面让大 家也一起来体验一下需要我们这些mongodb使用者需要注意的地方。

首先声明自己的英文水平不是太高,加之有些英文翻译成中文也找不到合适的词来表达,所以在文章中可能会出现英文原词,或者说有些地方的翻译会有些生 硬,也就是说会出现直译的地方。翻译该书的主要目的是为大家学习探讨用的,如果有翻译不精准的地方,或者说有更加精准的翻译,还请大家指出,我会及时的更 正的,在此先谢过各位了。

Tip#23.Don't always use an index

不要总是使用索引

之前讲到了使用索引的好处,但是让我提醒你一下,并不是所有的查询都应该使用索引。假设一下,在之前的例子中,你获取的是集合中90%的文档,而不是一小部分的文档。如果这种情况下,我们还是用索引的话,我们几乎要查询所有的索引。也就是说60G的索引都会加载到内存中,根据索引的指针还会加载230G的文档到内存。总共需要加载60G+230G=290G的数据到内存,这大大超过了不用索引的情况。

因此,索引通常在你查询的只是数据的一小部分的时候很管用。有一条经验法则可以参考,一旦你返回的数据超过一半以上,就不要使用索引了。

如果你在一个字段建立索引,但是要求返回大量的数据,是很低效的。这时候你可以通过再sort中指定{"$natural":1}来告诉mongodb,本次查询不要使用索引。这样就意味着将从磁盘的顺序返回数据,强制mongodb不使用索引。

 

  1. >db.foo.find().sort({"$natural":1})

如果一个查询强制不使用索引,mongodb将会扫描表,意味着通过对比所有的记录来找到符合条件的文档。

每次增加、删除、更新一条新的记录,索引都会更新。假设增加一条记录,mongodb或查询新节点的值需要落在索引树的哪个位置,然后在插入索引。对于删除,也需要找到并删除索引,更新值的话,也需要同样的过程。因此索引对于写操作来说会增加额外的工作。

 

返回MongoDB数据库教程...