1.一種基于多臂老虎機(jī)的信息年齡學(xué)習(xí)路徑感知恢復(fù)方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的一種基于多臂老虎機(jī)的信息年齡學(xué)習(xí)路徑感知恢復(fù)方法,其特征在于,所述重傳數(shù)據(jù)包的信息年齡表示為:
3.根據(jù)權(quán)利要求1所述的一種基于多臂老虎機(jī)的信息年齡學(xué)習(xí)路徑感知恢復(fù)方法,其特征在于,發(fā)送端向接收端發(fā)送多個(gè)主數(shù)據(jù)包時(shí),若其中一個(gè)或者多個(gè)主數(shù)據(jù)包丟失,接收端向發(fā)送端發(fā)送重傳數(shù)據(jù)指令,發(fā)送端接收到所述重傳數(shù)據(jù)指令后開始向接收端上傳重傳數(shù)據(jù)包。
4.根據(jù)權(quán)利要求1所述的一種基于多臂老虎機(jī)的信息年齡學(xué)習(xí)路徑感知恢復(fù)方法,其特征在于,獲得使得所述收益最大化的最優(yōu)路徑的過(guò)程包括:
5.根據(jù)權(quán)利要求4所述的一種基于多臂老虎機(jī)的信息年齡學(xué)習(xí)路徑感知恢復(fù)方法,其特征在于,所述貝葉斯可信邊界調(diào)節(jié)因子可表示為:
6.根據(jù)權(quán)利要求4所述的一種基于多臂老虎機(jī)的信息年齡學(xué)習(xí)路徑感知恢復(fù)方法,其特征在于,所述多臂老虎機(jī)當(dāng)前選擇的拉桿的頻次表示為:
7.根據(jù)權(quán)利要求4所述的一種基于多臂老虎機(jī)的信息年齡學(xué)習(xí)路徑感知恢復(fù)方法,其特征在于,基于貝葉斯可信邊界調(diào)節(jié)因子更新當(dāng)前收益時(shí),每條重傳路徑的收益值為:
8.根據(jù)權(quán)利要求1所述的一種基于多臂老虎機(jī)的信息年齡學(xué)習(xí)路徑感知恢復(fù)方法,其特征在于,平滑后重傳數(shù)據(jù)包的信息年齡服從對(duì)數(shù)正態(tài)分布,滿足關(guān)系:,其中: