• <output id="zhzz3"></output>

      1. <output id="zhzz3"><bdo id="zhzz3"><td id="zhzz3"></td></bdo></output>
              Renaissance
              Era
              詳細內容
              Detail




                  1. 技術架構:底層技術采用JAVA及C++技術,集成GIT的多用戶開發研究系統。

                  2. 實用功能:支持主流財經網站實時輿情采集及監控分析。

                  3. 代碼管理:連接時代復興REISM系統,同步檢測研發活動強度。

                  4. 硬件方案:負載均衡的服務器集群,分布式SSD存儲。

                  5. 性能參數:支持多并發毫秒級的復雜新聞輿情監控分析,通過多線程優化控制完成高并發任務。


              大量的國內外研究表明新聞事件可能會影響公司的價值。更進一步地,在給定市場理性化的前提下,新聞事件會在短時間內影響相應上市股市的股價。例如,企業并購、盈余公告、新舊債務以及財政赤字等新聞事件均會對上市公司的股價產生正面或負面的影響。

              另一方面,在國內A股市場中,非理性化(情緒化)現象嚴重。具體表現在在進行投資決策時以感覺和主題炒作和政策性炒作為主,只定性不定量,追漲殺跌氛圍濃郁。經分析,造成上述現象的原因可以總結為:(1)國內股市受政策性影響嚴重,使得事件對股市造成的影響遠大于國外市場;(2)個人投資者比例大,其非理性的投資觀念容易造成情緒化投資。因此,盡可能快速地獲取金融市場發生的新聞事件并對其反應的情緒進行挖掘與分析,從而掌握市場潛在的投資情緒變化或者波動,是一項利用新聞事件進行投資獲利的迫切需求。

              目前,信息獲取技術、自然語言處理技術以及文本挖掘技術都有了比較成熟的發展。互聯網、大數據時代的相繼到來,使得以指數增長的海量數據存在于互聯網中。關于金融領域的各種新聞事件也不例外。

              為了解決實時監控金融市場新聞,快速感知投資情緒波動,從而進行決策獲利的需求,我們開發了基于互聯網的金融新聞實時監控系統REFIMO(REnaissance FInance MOnitor)。主要功能是對主流的財經類網站新聞進行實時數據下載、解析并對解析后的新聞內容進行情感傾向的自動分析。該系統已經用于公司實際日常經營當中,取得了良好的挖掘和分析效果,日最大處理量可達百萬條新聞量級。

              該系統為投資決策和基于金融新聞的股市分析提供總體解決方案。系統還可以通過數據庫存儲與其他平臺進行快速集成和融合,全面支持用戶的生產、決策、營銷等領域活動,具有廣闊的應用前景。

              REFIMO體系結構

              1 基于互聯網的金融新聞大數據輿情實時監控系統REFIMO體系結構

              REFIMO系統整體上分為新聞采集與分析子系統以及存儲子系統兩部分。其中新聞采集與分析子系統訪問Internet,并與存儲子系統發生讀寫交互。具體地,位于新聞采集與分析子系統中的新聞探測器定時請求目標網站,獲取最新的頁面URL并向存儲子系統發送。位于新聞采集與分析子系統中的新聞采集與情感分析器在監聽到存儲子系統中有新數據到達時即裝載采集新聞網頁的URL,并訪問Internet請求相應網頁內容。之后,新聞采集與情感分析器實時對該新聞網頁進行正文提取以及情感分析,最后將分析結果寫入存儲子系統。

              新聞探測器執行流程

              2 新聞探測器執行流程圖

              上圖展示了新聞探測器的執行流程。首先,探測器采用定時執行的思想,當定時器到時后開始對目標網站進行探測。為提高探測效率,探測器采用多線程的方式進行探測,每一個線程探測一個網站。若當前探測網站存在新更新的新聞網頁,則抽取其URL并更新存儲子系統。探測器在否收到退出指令的情況下不斷定時執行,直到收到退出指令再退出。

              新聞采集器執行流程

               

              3 新聞采集器執行流程圖

              上圖展示了新聞采集器的執行流程圖。采集器首先從存儲子系統中獲取當前待下載隊列。若隊列為空,則說明當前沒有新探測到的新聞網頁,則采集器等待。若隊列不為空,則說明當前有新探測到的新聞網頁。則開始新聞的采集和語義分析操作。為了提升采集器的效率,我們使用了多線程并行策略。每一個線程是一個獨立的新聞采集器,它對應一個單一的網頁。采集器請求目標網頁內容并對網頁進行解析,網頁解析的流程稍后描述。在得到網頁正文后,我們使用基于Hownet以及金融行業領域詞典的算法對新聞內容進行情感分析。若該文章談及了具體的個股且對其有正面或負面的情感傾向,我們相應地則更新存儲子系統。否則,我們僅采集該新聞網頁正文數據。基于Hownet以及金融行業領域詞典的算法,首先讀入網頁正文,并對正文內容進行分句處理。之后,對于每一個句子中的詞和基準詞對在Hownet中計算詞語的相似度,并計算詞語的情感傾向。若該詞數屬于一個領域特殊的情感詞,則有可能該詞語在Hownet中并沒有情感傾向。此時,我們使用領域詞典獲取其情感傾向。根據此句中所有詞語的情感傾向,我們計算該句子的情感傾向。當處理完所有句子時,我們通過每一句的情感傾向計算整篇新聞的情感傾向。若為正,則認為該新聞對其中談論的股票存在利好。若為負,則認為存在利空。

               


              上一篇:沒有了

              下一篇:沒有了

              所屬類別: 輿情監控系統

              該資訊的關鍵詞為:

              扒下她的乳罩和内裤亲吻视频