1.一種數(shù)據(jù)管理設(shè)備(102),其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的數(shù)據(jù)管理設(shè)備(102),其特征在于,還包括上報(bào)模塊(112),所述上報(bào)模塊包括:
3.根據(jù)權(quán)利要求2所述的數(shù)據(jù)管理設(shè)備(102),其特征在于,所述圖(202、302、402)的每個(gè)節(jié)點(diǎn)包括與所述pii元素相關(guān)的至少一個(gè)接收到的文檔的信息;
4.根據(jù)權(quán)利要求2或3所述的數(shù)據(jù)管理設(shè)備(102),其特征在于,所述發(fā)現(xiàn)單元(112b)用于使用廣度優(yōu)先搜索遍歷所述圖(202、302、402)。
5.根據(jù)權(quán)利要求2至4中任一項(xiàng)所述的數(shù)據(jù)管理設(shè)備(102),其特征在于,通過將每個(gè)節(jié)點(diǎn)的所述準(zhǔn)確性分?jǐn)?shù)與路徑權(quán)重相乘,為所述每個(gè)節(jié)點(diǎn)計(jì)算所述加權(quán)因子,其中所述路徑權(quán)重是前一個(gè)節(jié)點(diǎn)的路徑權(quán)重、所述前一個(gè)節(jié)點(diǎn)的唯一性分?jǐn)?shù)和兩個(gè)節(jié)點(diǎn)之間的關(guān)系準(zhǔn)確性分?jǐn)?shù)的乘積。
6.根據(jù)權(quán)利要求5所述的數(shù)據(jù)管理設(shè)備(102),其特征在于,當(dāng)多個(gè)節(jié)點(diǎn)可供搜索時(shí),下一個(gè)待搜索的節(jié)點(diǎn)被確定為路徑權(quán)重與唯一性分?jǐn)?shù)的乘積值最大的節(jié)點(diǎn)。
7.根據(jù)權(quán)利要求2至6中任一項(xiàng)所述的數(shù)據(jù)管理設(shè)備(102),其特征在于,所述發(fā)現(xiàn)單元(112b)用于在所述加權(quán)因子低于預(yù)定義閾值時(shí),停止遍歷所述圖(202、302、402)。
8.根據(jù)權(quán)利要求7所述的數(shù)據(jù)管理設(shè)備(102),其特征在于,如果為同一主體找到共享共同類型的多個(gè)pii元素,則調(diào)整所述閾值。
9.一種數(shù)據(jù)管理的計(jì)算機(jī)實(shí)現(xiàn)方法(500),其特征在于,包括:
10.根據(jù)權(quán)利要求9所述的計(jì)算機(jī)實(shí)現(xiàn)方法(500),其特征在于,還包括:
11.根據(jù)權(quán)利要求10所述的計(jì)算機(jī)實(shí)現(xiàn)方法(500),其特征在于,所述圖(202、302、402)的每個(gè)節(jié)點(diǎn)包括與所述pii元素相關(guān)的至少一個(gè)接收到的文檔的信息;
12.根據(jù)權(quán)利要求10或11所述的計(jì)算機(jī)實(shí)現(xiàn)方法(500),其特征在于,遍歷所述圖(202、302、402)包括使用廣度優(yōu)先搜索。
13.根據(jù)權(quán)利要求10至12中任一項(xiàng)所述的計(jì)算機(jī)實(shí)現(xiàn)方法(500),其特征在于,通過將每個(gè)節(jié)點(diǎn)的所述準(zhǔn)確性分?jǐn)?shù)與路徑權(quán)重相乘,為所述每個(gè)節(jié)點(diǎn)計(jì)算所述加權(quán)因子,其中所述路徑權(quán)重是前一個(gè)節(jié)點(diǎn)的路徑權(quán)重、所述前一個(gè)節(jié)點(diǎn)的唯一性分?jǐn)?shù)和兩個(gè)節(jié)點(diǎn)之間的關(guān)系準(zhǔn)確性分?jǐn)?shù)的乘積。
14.根據(jù)權(quán)利要求13所述的計(jì)算機(jī)實(shí)現(xiàn)方法(500),其特征在于,當(dāng)多個(gè)節(jié)點(diǎn)可供搜索時(shí),下一個(gè)待搜索的節(jié)點(diǎn)被確定為路徑權(quán)重與唯一性分?jǐn)?shù)的乘積值最大的節(jié)點(diǎn)。
15.根據(jù)權(quán)利要求10至14中任一項(xiàng)所述的計(jì)算機(jī)實(shí)現(xiàn)方法(500),其特征在于,遍歷所述圖(202、302、402)包括:在所述加權(quán)因子低于預(yù)定義閾值時(shí),停止遍歷。
16.根據(jù)權(quán)利要求15所述的計(jì)算機(jī)實(shí)現(xiàn)方法(500),其特征在于,如果為同一主體找到共享共同類型的多個(gè)pii元素,則調(diào)整所述閾值。
17.一種計(jì)算機(jī)可讀介質(zhì),其特征在于,所述計(jì)算機(jī)可讀介質(zhì)包括指令,所述指令在由處理器(116)執(zhí)行時(shí),使得所述處理器(116)執(zhí)行權(quán)利要求9至16中任一項(xiàng)所述的方法。