PHP操作MongoDB时的整数问题及对策说明 |
本文标签:PHP,MongoDB MongoDB本身有两种整数类型,分别是:32位整数和64位整数,但旧版的PHP驱动不管操作系统是32位还是64位,把所有整数都当做32位整数处理,结果导致64位整数被截断 。为了在尽可能保持兼容性的前提下解决这个问题,新版PHP驱动加入了mongo.native-long选项,以期在64位操作系统中把整数都当做64位来处理,有兴趣的可参考:64-bit integers in MongoDB 。 那么PHP驱动真的完全解决了整数问题么?NO!在处理group操作的时候还有BUG: 为了说明问题,我们先来生成一些测试数据: 复制代码 代码如下: <?php ini_set(mongo.native_long, 1); $instance = new Mongo(); $instance = $instance->selectCollection(test, test); for ($i = 0; $i < 10; $i++) { $instance->insert(array( group_id => rand(1, 5), count => rand(1, 5), )); } ?> 下面让我们使用group操作,根据group_id分组,汇总计算count: 复制代码 代码如下: <?php ini_set(mongo.native_long, 1); $instance = new Mongo(); $instance = $instance->selectCollection(test, test); $keys = array(group_id => 1); $initial = array(count => 0); $reduce = function(obj, prev) { prev.count += obj.count; } ; $result = $instance->group($keys, $initial, $reduce); var_dump($result); ?> 结果和预想的有出入,count没有实现累加,而是变成了[object Object],目前,如果必须使用group操作,那么有两种方法可以缓解这个问题: 复制代码 代码如下: ini_set(mongo.native_long, 0); $initial = array(count => (float)0); 这两种方法都是治标不治本的权宜之计,既然当前PHP驱动里group的实现有问题,那我们就绕开它,用其它的方式实现同样的功能,这个方式就是MapReduce: 复制代码 代码如下: <?php ini_set(mongo.native_long, 1); $instance = new Mongo(); $instance = $instance->selectDB(test); $map = function() { emit(this.group_id, this.count); } ; $reduce = function(key, values) { var sum = 0; for (var index in values) { sum += values[index]; } return sum; } ; $result = $instance->command(array( mapreduce => test, map => $map, reduce => $reduce )); $result = iterator_to_array($instance->{$result[result]}->find()); var_dump($result); ?> 把大象放冰箱里需要三步,而使用MapReduce仅仅需要Map和Reduce两步即可,这里有一个PDF文档生动的说明了MySQL中GROUP BY和MongoDB中MapReduce的对应关系:
SQL to MongoDB 此外,还有很多资料可供参考,如:MongoDB Aggregation III: Map-Reduce Basics 。 说明:软件版本为MongoDB(1.6.5),PECL Mongo(1.1.4) 。不同版本结论可能不同 。 |