亚洲国内精品自在线影视,国产成人色美女av网址,日本老太婆XXXB视频,浓逼毛美女掰逼

您的位置:首頁 > 社會 >

聯(lián)合作戰(zhàn)模式下的信息過濾方法

2023-08-19 09:13:23 來源:互聯(lián)網(wǎng)

本文發(fā)表于《指揮信息系統(tǒng)與技術(shù)》2023年第2期

作者:馬雷鳴,張道偉

引用格式:馬雷鳴,張道偉. 聯(lián)合作戰(zhàn)模式下的信息過濾方法[J]. 指揮信息系統(tǒng)與技術(shù),2023,14(2):76-80.


【資料圖】

摘要

信息化作戰(zhàn)是當(dāng)前主要作戰(zhàn)方式之一,面向弱連接、高實時和資源受限的戰(zhàn)場邊緣網(wǎng)絡(luò)環(huán)境,以信息化技術(shù)為主導(dǎo)建立陸軍、海軍和空軍各兵種間可靠的和互連互通的協(xié)同作戰(zhàn)模式成為聯(lián)合作戰(zhàn)研究熱點?;谛畔⑽谋镜奶撛~特征,提出了一種聯(lián)合作戰(zhàn)模式下的信息過濾方法,通過模擬各軍兵種在云-邊-端協(xié)同模式下的信息過濾,既降低了作戰(zhàn)資源占用率又保障了作戰(zhàn)信息文本的高實時與唯一性。

0引言

聯(lián)合作戰(zhàn)指在現(xiàn)代戰(zhàn)場信息互連互通環(huán)境下的陸軍、海軍和空軍等軍兵種之間協(xié)同作戰(zhàn)的模式。針對戰(zhàn)術(shù)邊緣弱連接、高動態(tài)和高實時的網(wǎng)絡(luò)環(huán)境下各軍兵種聯(lián)合作戰(zhàn)需求,可通過建立云-邊-端協(xié)同架構(gòu)實現(xiàn)邊緣戰(zhàn)術(shù)信息的可靠傳輸。軍事領(lǐng)域中,云的網(wǎng)絡(luò)環(huán)境穩(wěn)定,計算存儲能力充足,并可按需共享存儲和通信網(wǎng)絡(luò)等資源;邊的資源較少,且部署在戰(zhàn)術(shù)邊緣;端由嵌入式終端、平板和手機組成,輕量便攜。

信息過濾一直是熱門研究問題,在資源受限的聯(lián)合作戰(zhàn)模式下,如何有效對重復(fù)的作戰(zhàn)信息進(jìn)行過濾不僅能夠節(jié)省資源,更是高實時和高動態(tài)的作戰(zhàn)實情的基本要求。目前,信息過濾方法可分為以下3種類型:

1) 基于URL(統(tǒng)一資源定位符)的過濾方法。該類方法基于以下假設(shè):具有相同URL的網(wǎng)絡(luò)資源一般是相同的。多軍兵種聯(lián)合作戰(zhàn)模式下重復(fù)的作戰(zhàn)信息的URL相同的概率更低,因此該類方法應(yīng)用較廣,其中常用的URL過濾方法是基于布隆過濾器進(jìn)行去重。

2) 基于協(xié)同的過濾方法。該類方法以用戶為基礎(chǔ),基于用戶的行為數(shù)據(jù)挖掘用戶喜好,從而篩選內(nèi)容,其中最近鄰協(xié)同過濾技術(shù)是目前常用技術(shù)之一。

3) 基于內(nèi)容的過濾方法。該類方法利用文本內(nèi)容進(jìn)行相似識別,從信息文本中提取一組特征,并基于特征進(jìn)行降維后再進(jìn)行相似度比較,從而判斷是否需要過濾。

1相關(guān)工作

英文文本過濾去重起源于20世紀(jì)70年代學(xué)術(shù)界存在的代碼重復(fù)問題,目前國外英文文本相似性檢測系統(tǒng)較多,其中常用的是iParadigms 公司開發(fā)的基于數(shù)字指紋的Tumitin平臺。漢語文本相似檢測最早由何云峰團(tuán)隊研發(fā),之后潘謙紅等提出了一種基于屬性論的文本相似度計算方法。Simhash算法是Google公司進(jìn)行海量去重的主要算法,其實質(zhì)是降維技術(shù),但在戰(zhàn)術(shù)邊緣環(huán)境下,計算資源有限且工作量繁重?;趨f(xié)同過濾的算法通過推測用戶喜好進(jìn)行選擇性信息過濾,由于戰(zhàn)場信息瞬息萬變且無法準(zhǔn)確推測用戶喜好,故不適用于聯(lián)合作戰(zhàn)模式下的信息過濾。

云-邊-端架構(gòu)中,云由各級中心云構(gòu)成,其網(wǎng)絡(luò)環(huán)境穩(wěn)定,并可按需共享通信網(wǎng)絡(luò)等資源;邊指覆蓋了各級各類業(yè)務(wù)信息系統(tǒng)的邊緣云,并可利用有限資源構(gòu)建高內(nèi)聚的服務(wù)能力;端由平板和手機等終端組成,具有輕量便攜的特征。邊對上可與中心云互連,對下可為終端用戶提供伴隨式服務(wù),也可與其他邊互連,共同形成云-邊-端的協(xié)同架構(gòu)。鑒于此,本文提出了一種聯(lián)合作戰(zhàn)模式下的信息過濾方法,先基于虛詞提取作戰(zhàn)信息樣本,再通過樣本組成特征碼,最后利用余弦相似度比較文本相似度。試驗結(jié)果表明,該方法適用于計算和存儲資源有限的聯(lián)合戰(zhàn)場環(huán)境。

2基于虛詞的信息過濾方法

聯(lián)合作戰(zhàn)模式下的信息過濾方法(本文方法)可對作戰(zhàn)信息進(jìn)行過濾,重復(fù)閾值以文獻(xiàn)提出的閾值為標(biāo)準(zhǔn):如果2篇文章之間有超過80%的用詞相同,則這2篇文章是重復(fù)的。本文方法流程如圖1所示,包括以下3個階段:1) 構(gòu)建云-邊-端架構(gòu)下的協(xié)同作戰(zhàn)模式,自主形成云-邊協(xié)同、邊-邊協(xié)同、云-端協(xié)同和端-端協(xié)同模式,并將各模式下的作戰(zhàn)信息匯聚至樣本庫;2) 對樣本庫中的作戰(zhàn)信息進(jìn)行特征提取,并對作戰(zhàn)信息樣本進(jìn)行抽??;3)對作戰(zhàn)信息樣本進(jìn)行特征碼提取,并基于余弦相似度進(jìn)行過濾操作,最終形成不含重復(fù)信息的作戰(zhàn)信息庫。

圖1 本文方法流程

2.1 云-邊-端架構(gòu)

在資源受限、窄帶寬和弱連接的戰(zhàn)場網(wǎng)絡(luò)環(huán)境中,構(gòu)建云-邊-端架構(gòu)是實現(xiàn)戰(zhàn)場可靠通信的有效途徑。當(dāng)網(wǎng)絡(luò)通信情況良好時,云可向下連接邊以形成云-邊協(xié)同,邊可向下連接端以形成邊-端協(xié)同,同時通過上下級同步實現(xiàn)作戰(zhàn)信息同步;當(dāng)邊和端因窄帶寬等原因造成與上級中心連接斷開時,可自動切換為采用對等協(xié)同模式隨遇接入可連接的自組網(wǎng)絡(luò)并共享資源,從而實現(xiàn)云-邊-端架構(gòu)下多種模式的無縫切換。云-邊-端架構(gòu)如圖2所示。

圖2 云-邊-端架構(gòu)

2.2 作戰(zhàn)信息特征提取

多數(shù)作戰(zhàn)信息文本會分段描述,而每個段落均占一定篇幅并出現(xiàn)大量虛詞,因此可基于虛詞提取作戰(zhàn)信息樣本,并基于樣本比較2條作戰(zhàn)信息是否重復(fù)?;谏鲜鐾茰y,本文利用文獻(xiàn)給出的在線網(wǎng)絡(luò)中的常用虛詞表對作戰(zhàn)信息特征進(jìn)行了提取。常用虛詞表如圖3所示。

圖3 常用虛詞表

2.3 作戰(zhàn)信息樣本抽取

大部分信息樣本均具有虛詞數(shù)不少于3個的段落?;诖?,本文初步假設(shè)以比較作戰(zhàn)信息樣本是否重復(fù)作為作戰(zhàn)信息過濾的判定依據(jù)是合理的。本文從軍事新聞網(wǎng)站抓取2則信息,標(biāo)記為作戰(zhàn)信息1和作戰(zhàn)信息2,如圖4和圖5所示。為了便于描述,定義如下:含虛詞數(shù)不少于3的自然段稱大段落(big paragraph);字?jǐn)?shù)不少于L的自然段稱長段落(long paragraph),若取L=20,則字?jǐn)?shù)不少于20的自然段就是長段落。

圖4 作戰(zhàn)信息1

圖5 作戰(zhàn)信息2

基于上述定義,本文對樣本庫中的作戰(zhàn)信息順序進(jìn)行了讀取并統(tǒng)計了大段落,將前3個大段落存入數(shù)據(jù)庫作為樣本以便后續(xù)試驗,如作戰(zhàn)信息1;對于篇幅較短且含大段落少于3個的情況進(jìn)行特殊處理,如作戰(zhàn)信息2,重新遍歷將前幾個長段落補齊3個組成為樣本。提取的作戰(zhàn)信息1樣本和作戰(zhàn)信息2樣本如圖6和圖7所示。

圖6 作戰(zhàn)信息1樣本

圖7 作戰(zhàn)信息2樣本

2.4 特征碼提取

2.5 相似度比較

2.6 評價標(biāo)準(zhǔn)

3試驗與分析

為了驗證本文方法的實際效果,本文從中國軍網(wǎng)隨機抓取新聞?wù)囊陨晌谋緲颖?。為了確保試驗的準(zhǔn)確性,抓取了同類別文本樣本和不同類別文本樣本2組數(shù)據(jù)。其中,樣本1為同類別文本樣本,指類別選擇為軍事的樣本,共計10 000條;樣本2為不同類別文本樣本,指選擇類別為陸軍、海軍、空軍、火箭軍和聯(lián)勤的樣本各2 000條,共計10 000條。本文方法信息過濾流程如圖8所示。

圖8 本文方法信息過濾流程

3.1 試驗步驟與結(jié)果

對樣本庫中的模擬作戰(zhàn)信息文本進(jìn)行以下操作:

1) 模擬云-邊-端協(xié)同模式,在試驗環(huán)境下通過筆記本、平板和手機分別模擬云、邊和端,并構(gòu)成三層架構(gòu)的協(xié)同關(guān)系,2臺手機模擬端-端對等協(xié)同關(guān)系,每次點擊“同步”時向同一數(shù)據(jù)庫發(fā)送作戰(zhàn)信息樣本;

2) 依次讀取樣本庫內(nèi)作戰(zhàn)信息樣本,統(tǒng)計含虛詞數(shù)是否不少于3,若是則記為大段落并保留,若大段落數(shù)不少于3,則將前3段作為樣本,停止讀??;若讀到最末行,大段落數(shù)仍少于3則從頭讀取,取最長的數(shù)個段落補齊3段作為樣本;

3) 提取樣本特征碼,并對2)中的樣本進(jìn)行分割,并將其中虛詞和標(biāo)點符號替換為空格;

4) 基于3)的特征碼比較余弦相似度,設(shè)定余弦相似度值為閾值,超過閾值則判定為重復(fù)文本;

5) 對樣本1和樣本2分別進(jìn)行試驗,試驗結(jié)果如圖9所示。由圖9(c)可知,樣本1當(dāng)閾值為0.82時, 值達(dá)到最大值,此時的準(zhǔn)確率P、召回率RF1值分別為98.7%、100%和99.3%;樣本2當(dāng)閾值為0.78時, 值達(dá)到最大值,此時的準(zhǔn)確率 、召回率 和 值分別為98.4%、100%和99.2%。

圖9 不同余弦相似度閾值下的評價指標(biāo)

3.2 試驗分析

本文方法通過虛詞將大文本樣本簡化為特征段,并使用余弦相似度進(jìn)行相似度比較,既簡化了計算又節(jié)省了計算資源。試驗結(jié)果可見,本文方法在同類樣本和不同類樣本上的準(zhǔn)確率P、召回率RF1值均達(dá)到了98%以上,確保了作戰(zhàn)資源獲取的唯一性;通過對重復(fù)信息進(jìn)行過濾,降低了資源占有率,適應(yīng)了資源受限的聯(lián)合戰(zhàn)場環(huán)境。

4結(jié)束語

本文基于虛詞和余弦相似度對聯(lián)合作戰(zhàn)模式下的信息過濾方法進(jìn)行了研究,并通過模擬自主切換的云-邊-端協(xié)同模式,對不同類型樣本進(jìn)行了作戰(zhàn)信息過濾試驗。本文方法通過對作戰(zhàn)信息進(jìn)行降維提高了文本相似度對比效率。試驗結(jié)果驗證了基于虛詞和余弦相似度的方法可對作戰(zhàn)信息進(jìn)行有效過濾,可節(jié)約邊緣戰(zhàn)術(shù)環(huán)境下的計算與存儲資源。

關(guān)鍵詞:

[責(zé)任編輯:xwzkw]

相關(guān)閱讀

湄潭县| 冷水江市| 若尔盖县| 红原县| 苗栗市| 昌黎县| 涿州市| 合作市| 汕尾市| 新源县| 铁岭县| 静安区| 获嘉县| 望谟县| 中西区| 顺平县| 河池市| 咸阳市| 绥滨县| 巨野县| 泰和县| 日照市| 南漳县| 平原县| 来宾市| 闽侯县| 辽宁省| 运城市| 小金县| 延寿县| 九龙县| 顺平县| 贵港市| 成安县| 新乡县| 景泰县| 潮州市| 金昌市| 大名县| 山阴县| 慈溪市|