您好, 訪客   登錄/注冊

一類多粒度近似周期關聯規則問題的挖掘研究

來源:用戶上傳      作者:

  摘要:研究一類在多粒度時間下單事件同屬性不同狀態之間有一定關聯的近似周期規律挖掘問題。給出了多粒度近似周期關聯規則模型形式化的數學定義和性質,構造了相關模型,提出了利用聚類算法挖掘周期模式并應用于股票數據進行實驗,實驗結果表明算法是有效的。
  關鍵字:近似周期;關聯規則;多粒度時間;數據挖掘
  中圖分類號:TP339 文獻標識碼:A
  大數據下的數據挖掘是當前的研究熱點,這些數據往往是隨時間變化的,即帶有顯性的或隱性的時態特征,如何從大數據中挖掘出有意義的時態周期模式是值得研究的一個方向。
  國內外已經有了一些關于周期模式的挖掘研究[1-3],但對近似周期的挖掘并不多見。然而現實世界中很多時間周期都不是嚴格的完美周期,比如說月經周期是21天-35天,并不是嚴格的30天,股票周期可能是7天-10天左右上漲一次等,并不是恰好7天。由于一些干擾因素的存在,嚴格的精確的周期模式挖掘往往會錯過一些有效的周期模式,為此我們提出了近似周期模式挖掘。文獻[4]提出的近似周期關聯規則是基于單一時間粒度,不過現實生活中人們往往更習慣于用多時間粒度來表示時間,比如說潮汐周期是24小時50分鐘,而不說1490分鐘。因此,文獻[5]提出了多粒時間下的近似周期挖掘,他們能發現股票周期大約是6分20秒左右上漲一次,但并不能發現多粒度時間下股票的上漲和下跌之間是否存在周期性關聯。為此,提出多粒度時間下的近似周期關聯規則挖掘問題,它能發現在多粒度時間下單事件同屬性不同狀態之間有一定關聯的近似周期規律。
  1 模型構造
  3 實驗結果與分析
  算法對2005年9月1日至2005年9月2日的580000寶鋼JTBI股票數據進行了實驗,以(分,10秒)為多粒度時間格式,買一價屬性編碼化狀態規則同文獻[2]。給定支持度閾值s= 5%,置信度閾值c= 55%,多粒度周期長度閾值L=(10,0)。在實驗中,發現了許多滿足要求多粒度近似周期關聯規則模式,這里僅列出部分最有意義的實驗結果于表1中。
  從表1可看出:(1)若A模式覆蓋B模式,隨著近似精度的增大,A模式的支持度和置信度也都增大。當近似精度為(0,0)時,均未發現滿足要求的周期規律,即沒有發現嚴格意義上精確的多粒度近似周期關聯規則,但當考慮到周期可能會出現一定的干擾,從而放寬了近似精度的時候,發現了很多滿足要求的多粒度近似周期關聯規則。(2)(買一價,5[(6,1).(7,1)],3)表明股票580000寶鋼JBTI的買一價大幅上漲和正常波動之間存在一定的多粒度周期關聯,在某個多粒度時間股票處于大幅上漲時,那么大約相隔6分10秒到7分10秒左右有94.047623%的可能性會出現正常波動,那么我們可以提前拋售此股票,以避免損失。(買一價,5[(9,0),(10,0)],3)表明股票580000寶鋼JBT1的買一價小幅下跌和正常波動之間存在一定的多粒度周期關聯,在某個多粒度時間處于小幅下跌時,那么大約相隔9分0秒到10分0秒左右有92.105263%的可能性會出現正常波動,那么此時我們可以提前購進此股票,在相隔9分到10分鐘左右拋出從而獲利。
  4 結論
  提出了一類多粒度時間下的多粒度近似周期關聯規則的數據挖掘問題,它適用于發現在多粒度時間下的單事件同屬性不同狀態之間有一定關聯的近似周期規律。即能發現在多粒度時間下A股票價格上漲和下跌之間的近似周期性關聯規則,但A股票價格的上漲下跌是否與B股票的上漲下跌存在周期性關聯,又或者A股票價格的上漲下跌加之B股票價格的上漲下跌是否和C股票的價格波動存在周期規律,這類多粒度時間下的多事件多維屬性狀態之間的近似周期關聯規則值得進一步研究,此外,多粒度近似周期關聯規則在大數據學習分析領域的應用研究也是未來值得繼續研究的一個方向。
  參考文獻
  [1]ANIRUDH A.KIRANYRU.REDDY P K.et al.Memory efficientmining of periodic—frequent patterns in transactional databases[C]//Computational Intelligence,IEEE,2017:1—8.
  [2] LIN C W,ZHANG J,FOURNIER—VIGER P,et al.Emcientmining()f short periodic high—utility itemsets [C]//IEEEIntemational Conference on Systems,Man,and Cybemetics.IEEE,2017:003083~003088.
  [3] SAMOLIYA M,TIWARI A.0n the use of rough set theory forminingperiodicfrequent pattems[J].IJSART,2015,11(1):21— 28.
  [4]姜華,孟志清,周克江.一類時態近似周期關聯規則的知識發現問題[J]計算機T程與應用,2010,46(20):241—244.
  [5]姜華,孟志清,周克江,等.多粒度時間下的近似周期挖掘研究[J].計算機T程,2010年,3(36):83—85,88.
轉載注明來源:http://www.hailuomaifang.com/8/view-14806385.htm

?
99久久国产综合精麻豆