什么是Jumbo chunk
就是超出设定的chunk大小的chunk,默认chunk大小为64M
为什么要处理Jumbo chunk
jumbo chunk无法被迁移
如何处理?
# 先找到Jumbo chunk信息
sh.status(true)
{ "phone" : NumberLong("xxxxxx") } -->> { "phone" : NumberLong("yyyyyyy") } on : shard_rep1 Timestamp(1, 19) jumbo
# 执行
# 对于上面的Jumbo块,执行如下命令
sh.splitFind("db.tb",{shardkeyX:"shardkeyXValue_in_range"})
脚本化自动处理
思路处理:
- 1.既然sh.status(true)可以发现jumbo chunk那么config库中一定记录着jumbo信息
- 2.从chunk的元数据表中找到标记为jumbo的数据快
- 3.处理超大的数据块
复制到mongos shell中执行即可
db = db.getSiblingDB('config');
var goblins=db.chunks.find({"jumbo":true})
goblins.forEach( function (item) {
databaseDotTable = item.ns;
minShardKeyInfo = item.min;
maxShardKeyInfo = item.max
for (var i in minShardKeyInfo) {
var key=i;
var value=minShardKeyInfo[i];
if (typeof(value) === "function") {
for (var j in maxShardKeyInfo) {
value = maxShardKeyInfo[j]
}
}
}
var findFilter = {}
findFilter[key] = value
print(`Doing db.adminCommand({"${databaseDotTable}",{${key}:${value}})}`);
result=db.adminCommand({split:databaseDotTable,find:findFilter});
printjson(result)
})
备注
1.官方推荐使用更加自动的sh.splitFind
而不是原始的sh.splitAt
函数