客服热线:   |  E-mail:

白姐急旋风

股票数据的爬取及趋势预测

  本文首先在东方财富网上爬取当前上海股票和深圳股票的所有股票代码,然后利用网易股票上的接口拉取每支股票从上市以来的历史成交数据,最后通过某一支股票的历史交易数据采用svm分类算法,对数据进行训练,进行涨跌趋势预测。

  如下图所示,通过查看页面源码可以发现a标签下的href属性结尾都是以shz + 股票代码 + .html形式结尾,所以通过正则表达式和requests库很容易爬取到所有股票列表。

  下载数据就比较简单了,直接通过网易股票接口,然后以股票代码命名在csv文件格式进行存储。

  通过上面的步骤已经顺利拿到了所有上市和深市自上市以来的交易数据,下面就是最关键的趋势预测了。本部分以600196为例,查看csv文件可以看到该股票已有四千多个交易日,我们可以选取前150个交易日的开盘价,收盘价,最高价,最低价以及成交量和当天开盘价作为影响股票当天涨跌的751个特征,然后利用已有数据进行80%作为训练,20%作为测试,进行交叉验证。

  //我所经历的大数据平台发展史(三):互联网时代 • 上篇编者按:本文是松子(李博源)的大数据平台发展史...

  美豹金融的美股大学--一、基础篇 1、美股 即美国股市。美国证券市场由于起步早,法律规范,参与人数众多等原因,至今执掌全球证券市场之牛耳。它由证券交易所,监管层,主流机构和个人投资者组成。 2、...

  1. Java基础部分 基础部分的顺序:基本语法,类相关的语法,内部类的语法,继承相关的语法,异常的语法,线程的语法,集合的语法,io的语法,虚拟机方面的语法。 1、一个.java源文件中是否可以包括多个类(不是内部类)?有什么限制? 可以有多个类,但只能有一个publ...

  中华人民共和国证券法 (1998年12月29日第九届全国人民代表大会常务委员会第六次会议通过 根据2004年8月28日第十届全国人民代表大会常务委员会第十一次会议《关于 修改〈中华人民共和国证券法〉的决定》修正2005年10月27日第十届全国 人民代表大会常务委员会第十八次...

  有一个葡萄园主,葡萄熟了,缺少人手,早上就去街上雇人手来采摘葡萄,和工人说好一天的工钱是一锭银子。于是工人们就去葡萄园采摘葡萄。上午时,园主看成熟的葡萄太多,人手不够,采摘不过来,就又去街上雇人来。到正午时看人手还不够,就又去雇人来,到傍晚时又去雇人来。到了晚上收...

  概念内涵、手中资料了然于胸,怎么遇到外延还是束手无策。名词解释就有三题《安徽俗語报》、《民史国口》、《可报》完全不会也没聽过,丝毫没有印象的外纲,中国新闻事业史花了我最多的时间备考,记忆难度是最大的,各种报纸刊物纷繁复杂,试卷仅八页,比其它科少了两页,反而是考试程度最难的。...

  1、这个节目男女匹配度很高,首先5选3或1选5,让男女配对的概率提高很多,其次,节目组带上父母,父母的亮相从很大程度上反应男女在原生态家庭的情况,因为中国的国情决定,结婚是2个家庭之间的碰撞,所以从见面认识开始,双方父母就参与其中,其实节省了很多时间成本,比自由恋爱1年多甚...

  你们要进窄门,因为引到死亡,那门是宽的,路是大的,进去的人也多;引到永生,那门是窄的,路是小的,找到的人也少。(《新约·马太福音》) 时常质疑自己,是否因为眼界或者心胸不够广阔,才会这般纠结局限于小我,为自身的得失斤斤计较,更是看不开亲人的离别与生死。 来到泉州已经四天,潦...

  最近,一直很苦恼,应该说自从单身以来,一直都在惶恐不安中度过。而这种苦恼的放大,是有人不断从旁提醒:你怎么还不恋爱?你怎么还不去找男人?怎么给你介绍的都不成?你怎么….怎么…. 好像,单身就像犯了罪,罪无可赦。往往随便说一个无关紧要的话题,别人总会用“你先有...

上一篇:国际金融协会数据显示:周一新兴市场股市和债

下一篇:获取历史和实时股票数据接口

顶部