騰訊政務云副總裁王景田向記者介紹道,此次人口普查的技術方案利用了企業(yè)微信這一現(xiàn)成產(chǎn)品,同時把普查需要的特定數(shù)據(jù)審核關系架構在上面。
這就意味著,如果公眾選擇自主申報,那么打開個人微信掃描普查員出示的二維碼即可;而對于700萬入戶普查員來說,則可以把他們看成一個公司,在企業(yè)微信的框架基礎上,普查員將進行數(shù)據(jù)的電子化登記及加密上傳,實現(xiàn)“智能終端做普查”。
據(jù)介紹,我國第七次全國人口普查項目籌備于今年3月啟動。騰訊云、企業(yè)微信相關員工與國家統(tǒng)計局工作人員合作,在新冠肺炎疫情期間完成了電子化的所有準備。
“我們應用了TDSQL和Tbase的數(shù)據(jù)庫產(chǎn)品,目前它們一起承接了每秒接近50萬次更新,這標志著我國的國產(chǎn)數(shù)據(jù)庫技術完全可以滿足政府金融的數(shù)字需求,而且在任務量這么大的極端情況下安全可靠?!蓖蹙疤锉硎?。
王景田稱,這一技術在研發(fā)實施的過程中,首先面臨著“人和戶要對應起來”的難題,這是一個復雜關系,也是時刻變動的關系,要把信息捕捉準不容易。
“項目開始后,我們發(fā)現(xiàn)我們對業(yè)務理解還是簡單了,登記的這15天里所有人員是流動的,比如一個人今年在北京,第二天又在深圳,”他舉例稱,由于一個人在15天內可能在多個地點出現(xiàn),其數(shù)據(jù)可能被多次重復登記,所以需要后期進行校驗,有一個“數(shù)據(jù)排重”的過程。
同時,在普查員完成登記后,要把數(shù)據(jù)間的邏輯關系搞清楚。例如普查員上門進行登記后,會發(fā)現(xiàn)家庭關系、父母子女關系、夫妻關系等多種社會關系,這些關系在數(shù)據(jù)處理工作中意味著,每一個數(shù)據(jù)都需要經(jīng)過700多條業(yè)務規(guī)則的校驗,這對整個系統(tǒng)來說是十分復雜的。
“大量的數(shù)據(jù)要收集上來,同時數(shù)據(jù)的更新和數(shù)據(jù)的查詢是互相交錯的,所以我們做了雙數(shù)據(jù)庫設計,一個數(shù)據(jù)庫專門用來做生產(chǎn)系統(tǒng)的處理,另一個數(shù)據(jù)庫用來查詢?!蓖蹙疤镎f。
此前,北京市昌平區(qū)統(tǒng)計局副局長、區(qū)人口普查辦常務副主任王建華曾對澎湃新聞記者表示,入戶登記階段基本上是1個普查員負責一個普查小區(qū),工作量在250到300人之間。
通過配置了“定制版”企業(yè)微信的Pad或手機電子采集器,普查員通過詢問戶主進行包括個人基本信息、住房、婚姻生育、死亡等情況的登記,再用電子采集器掃描、自動識別身份證號碼等信息,點擊上傳,一次入戶登記就完成了。與2010年全國第六次人口普查的紙表入戶登記方式相比,電子采集的方式將登記時間縮小到了20分鐘以內,也很大程度上降低了后期數(shù)據(jù)錄入、處理的難度。
值得注意的是,基于移動端的電子化普查手段,不僅是我國普查工作的一個技術革命,同時也引領了國際上普查手段的技術進步。
目前,國外的人口普查大多是基于PC端的,但我國此次采用的移動化終端采集可以說是電子化普查的最新手段,因此在國際的普查數(shù)據(jù)采集方面都起到引領作用。
王景田稱,在15天的入戶普查登記結束后,將是數(shù)據(jù)整理、分析的過程,騰訊云仍將對后期數(shù)據(jù)分析等環(huán)節(jié)獨家提供技術支持。