数学建模文献查找

编辑:小编时间:2018-09-05

在数学建模中文献资料的查找是十分关键,其实不仅是在数学建模中,在学习和做研究就是如此,不阅读文献资料就相当于闭门造车,什么都弄不出来,现在的工作几乎都可以说是站在前人的肩膀上,从出生开始就是站在前人的肩膀上了,所学的任何书本知识都是前人总结出来的。  
  通过文献资料的阅读可以知道别人在这个方面做了多少工作了,怎么做的工作,取得了哪些进展,还存在什么问题没解决,难点在哪里,热点在哪里,哪里是关键,哪些是有价值的,哪些是无意义的等等等等......,并且可以通过查找文献得到一些很有用的信息,比如某个教授牛的程度,所擅长的领域等等,呵呵,翻教授老底了,比较好玩,选导师的时候强烈推荐。   
 
文献查找主要有三个模式:   
A. 书      
B. 书+中外文期刊数据库     
C. 书+中外文期刊数据库+学位论文     
D. 书+中外文期刊数据库+学位论文+搜索引擎     
对于全国赛推荐D模式,但要改为Dc模式:中外文期刊数据库+学位论文   
对于美赛则要改为Da模式:外文期刊数据库+搜索引擎     
在此要解释下为何如此推荐,对于参加建模的来说一般书基本上是用不上了的,没必要去查了,直接查找数据库即可了,全国赛的题目大多是研究了很多年的东西了,这个也是和国内学术环境相关的,虽然近几年的赛题是体现最新形式的,但是相关的研究还是有的,还是可以参考的,要知道国内鲜有几个教授牛的站在国际前沿还给本科生出个数模题玩玩的,一般都是老东西新面孔的。也就是可以归类为学术研究类的新面孔老方法类。所以查数据库是最有效率的方法,并且查学位论文是尤其推荐的,要知道查找学位论文是最高效率得到信息的途径。虽然学位论文很长,很吓人,没有七八十页也有个一百多页,其实看多了学位论文就知道真正有用的东西页就那么个十多页最多二十多页,直接翻到那个部分看就可以了,为什么篇幅这么大就和中国的教育中的一些硬性指标相关了,每个级别的学位论文都有一个规定的字数范围,虽然大部分是垃圾,但为了达到这个字数要求也得凑足这个数字,水了,中国高等教育的悲哀啊。    
美赛则有语言障碍,要在有限时间内完成课题研究和论文写作,则需直接查找外文文献了,要知道中国目前的总体科学水平和国外的差距是至少5年的,这个是保守估计,实际可能是2倍以上。所以一般国外的当前研究国内鲜有涉及,当国外搞的很成熟了,产业化了,咱们国内就有教授引进了,开始研究了,吃点人家的残羹冷炙,这样说是刻薄了点,但这种情况真的不少见。这个就是中文数据库在美赛中无用的原因了。此外在美赛中用搜索引擎的实际效果好的往往出人意料,基本可以这么说,用搜索引擎比数据库来的更好,介绍一个n多人知道的技巧,怕还有人不知道就在此罗嗦下:搜索引擎用google足以,点击高级搜索,然后输入需要的 key words,在格式中选pdf格式。很简单吧,但很实用,填句弱智的话,报选择中文搜索啊,碰到过一次朋友如此搜索的,当时巨汗!很多参加数模的同学对 pdf格式了解很少,实在不应该吧,在下估计这帮人都是学习成绩好的不得了的,没怎么用过计算机和没怎么上网,并且是word的忠实铁杆用户。pdf格式就是一种国外通用的标准便携电子文档格式,要知道外国人几乎不用ms word的,微软发财中国人民的贡献巨大啊(虽然盗版盛行)。   
顺便介绍下国内外主要数据库的文献格式:pdg是超星格式,caj和caa为清华同方数据库(cnki)(它有三个名头,中国学术期刊网什么什么的NB名字也是指它),vip为维普,最重头的就是pdf,都需要不同的阅读器才能打开,还好都是免费的。    
在查找文献中很重要的一点是查找到的文献有效率,因为很多文献找到是没有用的,能有个3-4个有用的文献是很难得了的,通过数据库关键词查找到的文献的有效率是很低的,而通过查找已查找到的文献的参考文献是很有效的一种手段,其有效率则大大的提高了,通过这种连锁查找是强烈推荐的,尤其在美国赛中超级强烈推荐。   


列下中外文数据库
:   
中文:CNKI、VIP、万方 外文:EBSCO、Elserive、ProQuest、Springerlink、EI、ISI Web of Knowledge    
再列个电子图书站点,以备不时之需,中国数字图书馆,书生之家,超星数字图书馆     
有个情况就是好些学校不一定这些数据库都买了,这样就需要违点法了,搞破解。这些技术很复杂,在此不展开了。找代理啊,破解超星阅读器啊,下载书生的书,搜索CNKI,VIP,万方的帐户和密码,这些技术很有意思,很有挑战性和成就感,这也就是黑客盛行的原因吧。     
说了这么多,综述下吧,查找文献是决定参赛论文起点高低的关键。三天中做的课题很少是重新起灶的,一般都是在文献的基础上做的,所以找到的文献如果离所做的课题越近则参赛成绩会好。所以在查找文献多下点功夫不会错的,砍柴不误磨柴功。


对于参加建模 比赛来说,收集数据是很重要的一项任务,甚至直接决定了论文能不能进行下去,下面罗列了基本上所有的收集信息的网站方式 。




在这个用数据说话的时代,能够打动人的往往是用数据说话的理性分析,无论是对于混迹职场的小年轻,还是需要数据进行分析和研究的同学,能够找到合适的数据源都是非常重要的。特别是想要对一个新的领域进行研究和探索,拥有这个领域的数据是具有十分重要的意义。在这里给大家推荐一些能够用上数据获取方式,有了这些资源,不仅可以在数据收集的效率上能够得到很大的提升,同时也可以学习更多思维方式。
1. 公开的数据库
- 国家数据 -
http://data.stats.gov.cn/index.htm
 
数据来源于中国国家统计局,包含了我国经济民生等多个方面的数据,并且在月度、季度、年度都有覆盖,较为全面和权威,对于社会科学的研究不要太有帮助。最关键的是,网站简洁美观,还有专门的可视化读物。
- CEIC -
http://www.ceicdata.com/zh-hans
 
最完整的一套超过 128 个国家的经济数据,能够精确查找 GDP, CPI, 进口,出口,外资直接投资,零售,销售,以及国际利率等深度数据。其中的“ 中国经济数据库” 收编了 300,000 多条时间序列数据,数据内容涵盖宏观经济数据、行业经济数据和地区经济数据。
- wind( 万 得 )- http://www.wind.com.cn/
 
万得被誉为中国的 Bloomberg,在金融业有着全面的数据覆盖,金融数据的类目更新非常快, 据说很受国内的商业分析者和投资人的亲睐。
- 搜数网 -
http://www.soshoo.com/
 
已加载到搜数网站的统计资料达到 7,874 本,涵盖 1,761,009 张统计表格和 364,580,479 个统计数据,汇集了中国资讯行自 92 年以来收集的所有统计和调查数据,并提供多样化的搜索功能。
- 中国统计信息网 -
http://www.tjcn.org/
 
国家统计局的官方网站,汇集了海量的全国各级政府各年度的国民经济和社会发展统计信息,建立了以统计公报为主,统计年鉴、阶段发展数据、统计分析、经济新闻、主要统计指标排行等。






- 亚 马 逊 aws -
http://aws.amazon.com/cn/datasets/?nc1=h_ls
 
来自亚马逊的跨科学云数据平台,包含化学、生物、经济等多个领域的数据集。
- figshare -
https://figshare.com/
 
研究成果共享平台,在这里你会发现来自世界的大牛们的研究成果分享,同时 get 其中的研究数据,内容很有启发性,网站颇具设计感。
- github -
https://github.com/caesar0301/awesome-public-datasets
 
2. 数据交易平台
- 优易数据 -
http://www.youedata.com/
 
由国家信息中心发起,拥有国家级信息资源的数据平台,国内领先的数据交易平台。平台有
B2B、B2C 两种交易模式,包含政务、社会、社交、教育、消费、交通、能源、金融、健康等多个领域的数据资源。
- 数据堂 -
http://www.datatang.com/
 
专注于互联网综合数据交易,提供数据交易、处理和数据 API 服务,包含语音识别、医疗健康、交通地理、电子商务、社交网络、图像识别等方面的数据。
3. 网络指数
- 百度指数 -
http://index.baidu.com/
 
 
大家都很熟悉的指数查询平台,可以根据指数的变化查看某个主题在各个时间段受关注的情况,进行趋势分析、舆情预测有很好的指导作用。除了关注趋势之外,还有需求分析、人群画像等精准分析的工具,对于市场调研来说具有很好的参考意义。同样的另外两个搜索引擎搜狗、360 也有类似的产品,都可以作为参考。
- 阿里指数 -
https://alizs.taobao.com/
 
 
国内权威的商品交易分析工具,可以按地域、按行业查看商品搜索和交易数据,基于淘宝、天猫和 1688 平台的交易数据基本能够看出国内商品交易的概况,对于趋势分析、行业观察






意义不小。
- 艾瑞咨询 -
http://www.iresearch.com.cn/
 
艾瑞作为老牌的互联网研究机构,在数据的沉淀和数据分析上都有得天独厚的优势,在互联网的趋势和行业发展数据分析上面比较权威,艾瑞的互联网分析报告可以说是互联网研究的必读刊物。
- 友盟指数 -
http://www.umeng.com/
 
友盟在移动互联网应用数据统计和分析具有较为全面的统计和分析,对于研究移动端产品、做市场调研、用户行为分析很有帮助。除了友盟指数,友盟的互联网报告同样是了解互联网趋势的优秀读物。
- 爱奇艺指数 -
http://index.iqiyi.com/
 
爱奇艺指数是专门针对视频的播放行为、趋势的分析平台,对于互联网视频的播放有着全面的统计和分析,涉及到播放趋势、播放设备、用户画像、地域分布、等多个方面。由于爱奇艺庞大的用户基数,该指数基本可以说明实际情况。
- 猫眼专业版-
http://piaofang.maoyan.com/
 
电影票房统计分析平台,猫眼专业版有实时的票房统计,影片的排盘情况、上座率和影院数据,对于当前电影的分析是必不可少的。
4. 网络采集器
网络采集器是通过软件的形式实现简单快捷地采集网络上分散的内容,具有很好的内容收集作用,而且不需要技术成本,被很多用户作为初级的采集工具。
- 火车采集器 -
http://www.locoy.com/
 
一款专业的互联网数据抓取、处理、分析,挖掘软件,可以灵活迅速地抓取网页上散乱分布的数据信息,并通过一系列的分析处理,准确挖掘出所需数据,最常用的就是采集某些网站的文字、图片、数据等在线资源。接口比较齐全,支持的扩展比较好用,懂代码的话,可以使用 PHP 或 C#开发任意功能的扩展。
- 八 爪 鱼 -
http://www.bazhuayu.com/
 
简单实用的采集器,功能齐全,操作简单,不用写规则。特有的云采集,关机也可以在云服






务器上运行采集任务。
- 集搜客 -
http://www.gooseeker.com/
 
一款简单易用的网页信息抓取软件,能够抓取网页文字、图表、超链接等多种网页元素,提供好用的网页抓取软件、数据挖掘攻略、行业资讯和前沿科技等。
5. 网络爬虫
作为极客们最喜欢的数据收集方式,爬虫高度的自由性、自主性都使其成为数据挖掘的必备技能,当然精通 python 等语言是必要前提。
利用爬虫可以做很多有意思的事情,当然也可以获取一些从其它渠道获取不到的数据资源, 更重要的是帮你打开寻找和搜集数据的思路。
- 利用爬虫爬取网络图片 -
 
爬取的图像素材
你看到某个网站上的图片恰好是你需要的,但是量大单个下载太麻烦,那么利用爬虫你可以快速地进行抓取,并可以根据标签、特征、颜色等信息进行分类储存。从此不缺设计素材, 不缺美女图片,连斗图都多了几分自信。
- 利用爬虫爬取高质量资源 -
 
爬取的音乐资源
我们总是想快速地去搜集高质量的网络资源,但是人工查找比对实在太麻烦,利用爬虫你就可以轻松解决。比如爬取知乎点赞最多的文章列表,爬取网易云音乐评论最多的音乐,爬取豆瓣网高评分的电影或图书… … 总之,你可以从此拒绝平庸。
- 利用爬虫获取舆情数据 -
 
爬取的某招聘网站职位信息
比如你可以批量爬取社交平台的数据资源,可以爬取网站的交易数据,爬取招聘网站的职位信息等,可以用于个性化的分析研究。
总之,爬虫是非常强大的,甚至有人说天下没有不能爬的网站,因而爬取数据也成为了很多极客的乐趣。开发出高效的爬虫工具可以帮助我们节省很多时间,可以完全按照自己的需求来订制,想想这个世界就太美好。
6. 数据导航
收集数据是一种能力,学习收集数据也是一种能力,数据的来源是没有穷尽的,转换一种思维,你就可以获得不一样的数据,下面推荐几个可以用到的大数据导航,从这里面你可能会发现一些你自己想要的东西。每个人喜欢的收集数据的渠道不尽相同,只有尽量多地去见识和实践才会发现更多的适合自己的数据获取方式。






- 199IT 大数据导航 -
http://hao.199it.com/
 
- 数据分析网导航 -
http://www.afenxi.com/hao
 
- 大数据人导航 -
http://hao.bigdata.ren/
 
在互联网高度发达的今天,数据资源异常的丰富和庞大,如何高效地获取数据成为一种重要的能力,毕竟获取数据是一切用数据说话的前提。当然往往只需要熟练掌握一两种方法,便足够大多数人应付大多数场景和需求,所以选择合适的数据获取渠道还需要亲自探究。

Copyright (C) 2006–2021 河南省清北之道教育信息咨询有限公司版权所有
豫ICP备20019393号-1
地址:郑州市经开区第九大街88号
咨询热线:0371-55966148
友情链接:清北之道艺考官网