一種基于大數(shù)據(jù)技術(shù)的科技成果轉(zhuǎn)化平臺(tái)的制作方法

文檔序號(hào)：39526782發(fā)布日期：2024-09-27 17:03閱讀：47來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專(zhuān)利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

一種基于大數(shù)據(jù)技術(shù)的科技成果轉(zhuǎn)化平臺(tái)的制作方法

本發(fā)明涉及大數(shù)據(jù)，具體地說(shuō)，涉及一種基于大數(shù)據(jù)技術(shù)的科技成果轉(zhuǎn)化平臺(tái)。

背景技術(shù)：

1、一種基于大數(shù)據(jù)技術(shù)的科技成果轉(zhuǎn)化平臺(tái)旨在提高科技成果轉(zhuǎn)化效率和精準(zhǔn)匹配技術(shù)需求與科技成果，通過(guò)在計(jì)算標(biāo)簽匹配度和余弦特征相似度時(shí)引入技術(shù)需求和科技成果的時(shí)間相關(guān)性因子，以及使用局部?jī)?yōu)化匹配匈牙利算法找到匹配度矩陣中的最佳匹配對(duì)，實(shí)現(xiàn)了對(duì)最新技術(shù)需求數(shù)據(jù)和科技成果數(shù)據(jù)的高效、精準(zhǔn)分析分類(lèi)，優(yōu)化科技成果的轉(zhuǎn)化過(guò)程，提升匹配的實(shí)用性和準(zhǔn)確性。現(xiàn)有的科技成果轉(zhuǎn)化平臺(tái)通常難以有效處理大規(guī)模和多樣化的數(shù)據(jù)，且由于技術(shù)需求和市場(chǎng)需求變化快以及信息共享和交流不足，會(huì)導(dǎo)致科技成果和需求方的匹配并轉(zhuǎn)化效率低的問(wèn)題，因此，設(shè)計(jì)一種基于大數(shù)據(jù)技術(shù)的科技成果轉(zhuǎn)化平臺(tái)。

技術(shù)實(shí)現(xiàn)思路

1、本發(fā)明的目的在于提供一種基于大數(shù)據(jù)技術(shù)的科技成果轉(zhuǎn)化平臺(tái)，以解決上述背景技術(shù)中提出的由于技術(shù)需求和市場(chǎng)需求變化快以及信息共享和交流不足，會(huì)導(dǎo)致科技成果和需求方的匹配并轉(zhuǎn)化效率低的問(wèn)題。

2、為實(shí)現(xiàn)上述目的，本發(fā)明目的在于提供了一種基于大數(shù)據(jù)技術(shù)的科技成果轉(zhuǎn)化平臺(tái)，包括：

3、信息采集單元，所述信息采集單元基于數(shù)據(jù)收集策略，收集來(lái)自企業(yè)和科研機(jī)構(gòu)歷史和最新技術(shù)需求數(shù)據(jù)和科技成果數(shù)據(jù)，將歷史和最新技術(shù)需求數(shù)據(jù)和科技成果數(shù)據(jù)提供給數(shù)據(jù)處理中心進(jìn)一步處理；

4、還包括數(shù)據(jù)處理中心，所述數(shù)據(jù)處理中心使用apache?spark結(jié)合pandas對(duì)歷史和最新技術(shù)需求數(shù)據(jù)和科技成果數(shù)據(jù)進(jìn)行清洗與轉(zhuǎn)換，并使用scikit-learn和隨機(jī)森林分類(lèi)器，訓(xùn)練技術(shù)需求分類(lèi)模型和科技成果分類(lèi)模型；

5、還包括分類(lèi)與匹配單元，所述分類(lèi)與匹配單元利用技術(shù)需求分類(lèi)模型和科技成果分類(lèi)模型，對(duì)數(shù)據(jù)處理中心提供最新技術(shù)需求數(shù)據(jù)和科技成果數(shù)據(jù)進(jìn)行分類(lèi)，并使用分類(lèi)匹配函數(shù)，引入技術(shù)需求和科技成果的時(shí)間相關(guān)性因子，并結(jié)合局部?jī)?yōu)化匹配匈牙利算法進(jìn)行技術(shù)需求與科技成果分類(lèi)結(jié)果的匹配；

6、還包括管理轉(zhuǎn)化單元，所述管理轉(zhuǎn)化單元用于管理科技成果的匹配轉(zhuǎn)化過(guò)程。

7、作為本技術(shù)方案的進(jìn)一步改進(jìn)，所述數(shù)據(jù)收集策略用于輔助信息采集單元收集歷史和最新技術(shù)需求數(shù)據(jù)和科技成果數(shù)據(jù)，數(shù)據(jù)收集策略具體包括：收集數(shù)據(jù)類(lèi)型；數(shù)據(jù)源選擇；數(shù)據(jù)抓取頻率；數(shù)據(jù)格式規(guī)范；隱私與合規(guī)；異常處理機(jī)制。

8、作為本技術(shù)方案的進(jìn)一步改進(jìn)，所述信息采集單元基于數(shù)據(jù)收集策略，收集歷史和最新技術(shù)需求數(shù)據(jù)和科技成果數(shù)據(jù)，具體步驟如下：

9、s1.1、配置網(wǎng)絡(luò)爬蟲(chóng)和api接口，設(shè)置爬取規(guī)則，自動(dòng)抓取數(shù)據(jù)源的歷史和最新技術(shù)需求數(shù)據(jù)和科技成果數(shù)據(jù)，并存儲(chǔ)在臨時(shí)數(shù)據(jù)庫(kù)中；

10、s1.2、將歷史和最新技術(shù)需求數(shù)據(jù)和科技成果數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一的json格式，去除重復(fù)的數(shù)據(jù)，并根據(jù)歷史和最新技術(shù)需求數(shù)據(jù)和科技成果數(shù)據(jù)之間的關(guān)聯(lián)屬性進(jìn)行數(shù)據(jù)合并，得到歷史和最新技術(shù)需求數(shù)據(jù)和科技成果數(shù)據(jù)；

11、s1.3、將歷史和最新技術(shù)需求數(shù)據(jù)和科技成果數(shù)據(jù)傳遞至數(shù)據(jù)處理中心。

12、作為本技術(shù)方案的進(jìn)一步改進(jìn)，所述數(shù)據(jù)處理中心包括清洗轉(zhuǎn)換模塊和數(shù)據(jù)訓(xùn)練模塊；

13、其中，所述清洗轉(zhuǎn)換模塊使用apache?spark和pandas處理歷史和最新技術(shù)需求數(shù)據(jù)和科技成果數(shù)據(jù)的缺失值與異常值，并將歷史和最新技術(shù)需求數(shù)據(jù)和科技成果數(shù)據(jù)轉(zhuǎn)化為json格式；

14、所述數(shù)據(jù)訓(xùn)練模塊使用scikit-learn和隨機(jī)森林分類(lèi)器，并基于歷史技術(shù)需求數(shù)據(jù)和科技成果數(shù)據(jù)，訓(xùn)練技術(shù)需求分類(lèi)模型和科技成果分類(lèi)模型。

15、作為本技術(shù)方案的進(jìn)一步改進(jìn)，所述清洗轉(zhuǎn)換模塊使用apache?spark和pandas處理歷史和最新技術(shù)需求數(shù)據(jù)和科技成果數(shù)據(jù)的缺失值與異常值，并將歷史和最新技術(shù)需求數(shù)據(jù)和科技成果數(shù)據(jù)轉(zhuǎn)化為json格式：

16、s2.1.1、從json文件中讀取歷史和最新技術(shù)需求數(shù)據(jù)和科技成果數(shù)據(jù)，并將其加載到spark?dataframe中；

17、s2.1.2、去除包含缺失值的行，以及過(guò)濾異常值的行；

18、s2.1.3、將spark?dataframe轉(zhuǎn)換為pandas?dataframe；

19、s2.1.4、去除包含缺失值的行，以及過(guò)濾異常值的行；

20、s2.1.5、將pandas?dataframe轉(zhuǎn)換為json格式。

21、作為本技術(shù)方案的進(jìn)一步改進(jìn)，所述數(shù)據(jù)訓(xùn)練模塊使用scikit-learn和隨機(jī)森林分類(lèi)器，并基于歷史技術(shù)需求數(shù)據(jù)和歷史科技成果數(shù)據(jù)，訓(xùn)練技術(shù)需求分類(lèi)模型和科技成果分類(lèi)模型，具體方法如下：

22、s2.2.1、將歷史技術(shù)需求數(shù)據(jù)分為特征矩陣和標(biāo)簽向量，并將百分之七十的歷史技術(shù)需求數(shù)據(jù)劃分為訓(xùn)練集，將百分之三十的歷史技術(shù)需求數(shù)據(jù)劃分為測(cè)試集；

23、s2.2.2、將歷史科技成果數(shù)據(jù)分為特征矩陣和標(biāo)簽向量，并將百分之七十的歷史科技成果數(shù)據(jù)劃分為訓(xùn)練集，將百分之三十的歷史科技成果數(shù)據(jù)劃分為測(cè)試集；

24、s2.2.3、使用隨機(jī)森林分類(lèi)器對(duì)歷史技術(shù)需求數(shù)據(jù)的訓(xùn)練集進(jìn)行訓(xùn)練，建立技術(shù)需求分類(lèi)模型：

25、；

26、其中，表示隨機(jī)森林分類(lèi)器；表示歷史技術(shù)需求數(shù)據(jù)預(yù)測(cè)的標(biāo)簽；

27、s2.2.4、使用隨機(jī)森林分類(lèi)器對(duì)歷史科技成果數(shù)據(jù)的訓(xùn)練集進(jìn)行訓(xùn)練，建立科技成果分類(lèi)模型：

28、；

29、其中，表示隨機(jī)森林分類(lèi)器；表示歷史科技成果數(shù)據(jù)預(yù)測(cè)的標(biāo)簽；

30、s2.2.5、使用歷史技術(shù)需求數(shù)據(jù)的測(cè)試集對(duì)技術(shù)需求分類(lèi)模型進(jìn)行模型測(cè)試和使用歷史科技成果數(shù)據(jù)的測(cè)試集對(duì)科技成果分類(lèi)模型進(jìn)行模型測(cè)試。

31、作為本技術(shù)方案的進(jìn)一步改進(jìn)，所述分類(lèi)與匹配單元，包括數(shù)據(jù)分類(lèi)模塊和需求匹配模塊；

32、其中，所述數(shù)據(jù)分類(lèi)模塊使用技術(shù)需求分類(lèi)模型和科技成果分類(lèi)模型對(duì)最新技術(shù)需求數(shù)據(jù)和最新科技成果數(shù)據(jù)進(jìn)行分類(lèi)；

33、所述需求匹配模塊使用分類(lèi)匹配函數(shù)，引入技術(shù)需求和科技成果的時(shí)間相關(guān)性因子，并結(jié)合局部?jī)?yōu)化匹配匈牙利算法進(jìn)行技術(shù)需求與科技成果分類(lèi)結(jié)果的匹配，具體方法如下：

34、s3.1、獲取最新技術(shù)需求分類(lèi)模型分類(lèi)結(jié)果和特征矩陣以及獲取最新科技成果分類(lèi)模型分類(lèi)結(jié)果和特征矩陣；

35、s3.2、定義時(shí)間相關(guān)性因子為技術(shù)需求和科技成果的時(shí)間差異的函數(shù)，并根據(jù)時(shí)間相關(guān)性因子計(jì)算標(biāo)簽匹配度和余弦特征相似度，構(gòu)建引入時(shí)間相關(guān)性因素的匹配度矩陣；

36、s3.3、使用局部?jī)?yōu)化匹配匈牙利算法找到匹配度矩陣中的匹配對(duì)，并輸出匹配對(duì)。

37、所述s3.2中，計(jì)算標(biāo)簽匹配度和余弦特征相似度，構(gòu)建匹配度矩陣，具體方法如下：

38、時(shí)間相關(guān)性因子:

39、;

40、其中，為技術(shù)需求的時(shí)間戳；為科技成果的時(shí)間戳；是時(shí)間尺度因子；

41、標(biāo)簽匹配度：

42、；

43、其中，為最新技術(shù)需求數(shù)據(jù)第條記錄的預(yù)測(cè)標(biāo)簽；為最新科技成果數(shù)據(jù)第條記錄的預(yù)測(cè)標(biāo)簽；

44、余弦特征相似度：

45、；

46、其中，為最新技術(shù)需求數(shù)據(jù)第條記錄的特征向量；為最新科技成果數(shù)據(jù)第條記錄的特征向量；為最新技術(shù)需求特征向量的歐氏范數(shù)；為最新科技成果特征向量的歐氏范數(shù)；

47、匹配度矩陣：

48、；

49、所述s3.2中，使用局部?jī)?yōu)化匹配匈牙利算法找到匹配度矩陣中的匹配對(duì)，并輸出匹配對(duì)，具體方法如下：

50、s3.2.1、對(duì)初步匹配對(duì)進(jìn)行局部搜索，尋找和使得最大化，對(duì)每個(gè)匹配對(duì)，計(jì)算相鄰元素的匹配度:

51、;

52、s3.2.2、若局部搜索得到更優(yōu)匹配對(duì)，則更新匹配對(duì);

53、s3.2.3、計(jì)算全局匹配：

54、;

55、其中，是優(yōu)化后的匹配決策變量，值為1時(shí)表示與匹配，為0時(shí)表示與不匹配；

56、s3.2.4、將匹配的技術(shù)需求和科技成果數(shù)據(jù)對(duì)輸出，形成最終的匹配對(duì)列表。

57、作為本技術(shù)方案的進(jìn)一步改進(jìn)，所述管理轉(zhuǎn)化單元包括合同管理模塊、進(jìn)度跟蹤模塊和績(jī)效評(píng)估模塊；

58、其中，所述合同管理模塊用于記錄和跟蹤科技成果轉(zhuǎn)化合同；進(jìn)度跟蹤模塊用于跟蹤技術(shù)需求和科技成果匹配后的轉(zhuǎn)化進(jìn)度；績(jī)效評(píng)估模塊用于評(píng)估科技成果轉(zhuǎn)化的績(jī)效。

59、與現(xiàn)有技術(shù)相比，本發(fā)明的有益效果：

60、1、該基于大數(shù)據(jù)技術(shù)的科技成果轉(zhuǎn)化平臺(tái)中，通過(guò)構(gòu)建技術(shù)需求分類(lèi)模型和科技成果分類(lèi)模型，并在計(jì)算標(biāo)簽匹配度和余弦特征相似度時(shí)引入時(shí)間相關(guān)性因子，對(duì)最新技術(shù)需求數(shù)據(jù)和科技成果數(shù)據(jù)進(jìn)行分類(lèi)，可以顯著提高分類(lèi)的準(zhǔn)確性和效率，確保技術(shù)需求和科技成果在技術(shù)和時(shí)間維度上的精確分類(lèi)。

61、2、該基于大數(shù)據(jù)技術(shù)的科技成果轉(zhuǎn)化平臺(tái)中，使用局部?jī)?yōu)化匹配匈牙利算法對(duì)分類(lèi)匹配函數(shù)match進(jìn)行改進(jìn)，找到匹配度矩陣中的最佳匹配對(duì)，可以實(shí)現(xiàn)高效且精準(zhǔn)地匹配技術(shù)需求與科技成果，確保科技成果能夠快速滿(mǎn)足具體技術(shù)需求，從而大幅提高轉(zhuǎn)化成功率。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁(yè)1 2

該技術(shù)已申請(qǐng)專(zhuān)利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：張萬(wàn)偉
技術(shù)所有人：青島中投創(chuàng)新技術(shù)轉(zhuǎn)移有限公司
我是此專(zhuān)利的發(fā)明人

該領(lǐng)域下的技術(shù)專(zhuān)家
如您需求助技術(shù)專(zhuān)家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢(xún)。
1、李老師：1.計(jì)算力學(xué) 2.無(wú)損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專(zhuān)家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢(xún)問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

午夜毛片免费看,老师老少妇黄色网站,久久本道综合久久伊人,伊人黄片子

一種基于大數(shù)據(jù)技術(shù)的科技成果轉(zhuǎn)化平臺(tái)的制作方法