1.一種基于大數(shù)據(jù)技術(shù)的科技成果轉(zhuǎn)化平臺,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的基于大數(shù)據(jù)技術(shù)的科技成果轉(zhuǎn)化平臺,其特征在于:所述數(shù)據(jù)收集策略用于輔助信息采集單元(1)收集歷史和最新技術(shù)需求數(shù)據(jù)和科技成果數(shù)據(jù),數(shù)據(jù)收集策略具體包括:收集數(shù)據(jù)類型;數(shù)據(jù)源選擇;數(shù)據(jù)抓取頻率;數(shù)據(jù)格式規(guī)范;隱私與合規(guī);異常處理機(jī)制。
3.根據(jù)權(quán)利要求1所述的基于大數(shù)據(jù)技術(shù)的科技成果轉(zhuǎn)化平臺,其特征在于:所述信息采集單元(1)基于數(shù)據(jù)收集策略,收集歷史和最新技術(shù)需求數(shù)據(jù)和科技成果數(shù)據(jù),具體步驟如下:
4.根據(jù)權(quán)利要求1所述的基于大數(shù)據(jù)技術(shù)的科技成果轉(zhuǎn)化平臺,其特征在于:所述數(shù)據(jù)處理中心(2)包括清洗轉(zhuǎn)換模塊和數(shù)據(jù)訓(xùn)練模塊;
5.根據(jù)權(quán)利要求4所述的基于大數(shù)據(jù)技術(shù)的科技成果轉(zhuǎn)化平臺,其特征在于:所述清洗轉(zhuǎn)換模塊使用apache?spark和pandas處理歷史和最新技術(shù)需求數(shù)據(jù)和科技成果數(shù)據(jù)的缺失值與異常值,并將歷史和最新技術(shù)需求數(shù)據(jù)和科技成果數(shù)據(jù)轉(zhuǎn)化為json格式具體如下:
6.根據(jù)權(quán)利要求4所述的基于大數(shù)據(jù)技術(shù)的科技成果轉(zhuǎn)化平臺,其特征在于:所述數(shù)據(jù)訓(xùn)練模塊使用scikit-learn和隨機(jī)森林分類器,并基于歷史技術(shù)需求數(shù)據(jù)和歷史科技成果數(shù)據(jù),訓(xùn)練技術(shù)需求分類模型和科技成果分類模型,具體方法如下:
7.根據(jù)權(quán)利要求1所述的基于大數(shù)據(jù)技術(shù)的科技成果轉(zhuǎn)化平臺,其特征在于:所述分類與匹配單元(3),包括數(shù)據(jù)分類模塊和需求匹配模塊;
8.根據(jù)權(quán)利要求7所述的基于大數(shù)據(jù)技術(shù)的科技成果轉(zhuǎn)化平臺,其特征在于:所述需求匹配模塊使用分類匹配函數(shù),引入技術(shù)需求和科技成果的時間相關(guān)性因子,并結(jié)合局部優(yōu)化匹配匈牙利算法進(jìn)行技術(shù)需求與科技成果分類結(jié)果的匹配,具體方法如下:
9.根據(jù)權(quán)利要求8所述的基于大數(shù)據(jù)技術(shù)的科技成果轉(zhuǎn)化平臺,其特征在于:所述s3.2中,計(jì)算標(biāo)簽匹配度和余弦特征相似度,構(gòu)建匹配度矩陣,具體方法如下:
10.根據(jù)權(quán)利要求1所述的基于大數(shù)據(jù)技術(shù)的科技成果轉(zhuǎn)化平臺,其特征在于:所述管理轉(zhuǎn)化單元(4)包括合同管理模塊、進(jìn)度跟蹤模塊和績效評估模塊;