mathModels

记录数模笔记

搜索技巧(百度)

完全匹配搜索:查询词的外边加上双引号””

  • 引号中英文均可 例如我需要查找武汉城市学院,百度可能会出现”武汉这座英雄城市有一所学院balabala“,但是我们要找的是武汉城市学院,当我们加上引号之后只会出现有关于”武汉城市学院“

标题必含关键词:查询词前加上intitle:

  • 冒号为英文输入下的 例如我需要查找武汉城市学院,百度可能会出现”标题”全国民办大学排行榜“,然后内容里面有武汉城市学院,但是当我们加上intitle则所有的标题里面都含有“武汉城市学院”

搜索文档:例如查询词后空格再输入filetype:文件格式(doc/pdf/xls/等等)

  • 例如搜索:”张子烨的论文filetype:pdf “

去掉不想要的:查询词后面加空格后加减号与关键字

  • 例如搜索后不想看csdn的东西,搜索“张子烨的论文filetype:pdf -csdn”

查文献

高级检索:想了解神经网络在信贷策略中的应用,想找一些相关的硕博论文

  1. 进入高级检索界面,“+”和“-”可以自定义增加和减少检索字段

  2. 主题为:企业信贷

  3. OR主题为:信贷决策

  4. AND 关键词:神经网络,词频设置为“模糊”。模糊”是输入的检索词在检索结果中出现字间间隔可以产生变化。

  5. 检索结果可按“相关度”或“被引”排序

部分相关网站

  1. 谷歌学术镜像 http://scholar.hedasudi.com/
  2. open Access Library https://www.oalib.com/

查数据

知网、谷歌学术等平台搜索国家统计局

  • 最全面,月度季度年度,各地区各部门各行业,包罗万象
  • https://data.stats.gov.cn/
  • 其他国家部门网站大多都有数据分页,如果需要可另行查找

awesome-public-datasets

GitHub上的一个项目,包含了经济、地理、能源、教育等所有你能想到的领域的数据https://github.com/awesomedata/awesome-public-datasets

EPSDATA平台

EPSDATA平台有丰富的数据资源和大量分析处理过的数据结果,是收费的,不过可以申请7天的试用. https://www.epsnet.com.cn/

其他:国家信息中心,kaggle,和鲸社区

数据预处理

  1. 缺失值
  • 当缺失太多,超过30%,直接删除
  • 缺失的不多
    • 最简单的处理:均值,众值插入
      • **适用赛题:**人口的数量年龄、经济产业情况等统计数据,对个体精度要求不大的数据
    • 牛顿插值法
      • 根据固定公式,构造近似函数,补上缺失值,普遍适用性强,但是缺点是:区间边缘处的不稳定震荡,即龙格现象。不适合对导数有要求的题目
      • **适用赛题:**热力学温度、地形测量、定位等只追求函数值精准而不关心变化的数据
    • 样条插值法:
      • 用分段光滑的曲线去插值,光滑意味着曲线不仅连续,还要有连续的曲率
      • **适用赛题:**零件加工,水库水流量,图像“基线漂移”,机器人轨迹等精度要求高、没有突变的数据
  1. 异常值
  • 当样本中明显和其他数值差异很大的数据,例如一群人的身高数据中有个3米2的,直接删掉
    • 正态分布原则3σ原则
      • 求解步骤:
        • 1.计算均值u和标准差σ
        • 2.判断每个数据值是否在(u-3σ,u +3 σ )内,不在则为异常值σ
      • 适用题目:总体符合正态分布,例如人口数据、测量误差、生产加工质量、考试成绩等
      • **不适用题目:**总体符合其他分布,例如公交站人数排队论符合泊松分布

排版注意事项

  1. 各级标题与正文层次分明

    • 一般标题级别不超过三级
    • 正文中文字体设置宋体、英文Times New Roman

    反面例子:

    image-20230830220328576

    好家伙,直接三段文字三段不一样的字体,字号,行间距,直接展现出了作者的强大的office的功底

  2. 正文排版紧凑,看起来充实,没有大片空白

    • 避免图片过大导致出现大片空白,且不要留有空行

    反面例子:

    image-20230830220518364

    这片空白像我的脑子一样

  3. 表格与图片

    • 表格用标准的三线表(不要用网格表,血的教训)
    • 表的标题放在表的上方,图名放在图的下方

    反面例子:

    image-20230830220622999

    标准的错误,经典的零分 —武忠祥

    正面例子:

    image-20230830220807393

    表下图上,加分!

    反面例子:

    image-20230830221009519

    人首分离了属于是

  4. 公式编辑

    • 建议用markdown或者是latex编写公式
    • 公式需要解释清楚每个变量的意义;每个公式后面带有编号

    反面例子:

    image-20230830220903847

    你倒是标注序号啊

  5. 标题 (基于xxx模型的xxx问题研究)

    • 读完标题,就能知道本文建的是什么模型,选一些通俗易懂的词汇
    • 避免出现公式、非公知公用的缩写
    • 字数限制在一行内
    • xxx模型就是最重要的模型,xxx问题就是赛题的中心词
  6. 摘要(最重要的)

    • 基本要求

      • 摘要是对论文的高度概括总结
      • 让评阅老师读完摘要,就知道本文解决的问题、建立的模型和求解结果。
    • 注意事项

      • 不能出现图表或者是表格
      • 控制在3/4页到一页,字数大约在800~1000,同时一定要段落清晰
    • 格式如下:
      开头段模板:本文主要研究了XXX问题。根据XXX,利用XXX模型/方法,求解出XXX。

      • 第一句:说清楚研究的问题
      • 第二句:说清全文采用的模型/算法,采取的操作
      • 开头段不要求写结果

      **中间段模板:**针对问题一/二/三/…,考虑/根据XXX,…,建立XXX模型/利用XXX方法,…求解出XXX。

      • 一定要写清结果!
        • 优化类、预测类和物理类的题目,要明确写清数值
        • 要求提供建议或评价的题目,写要明确写清结论和数据依据,但不要有表格;数据过多可说明数据见附录

      结尾:

      • 如果写完后摘要超过一页了,可以不写
      • 不要累赘重复前面写过的内容
      • 写一些本文的特色、自夸的语句(吹牛逼,先把评委骗到手再说)

      摘要:

      • 关键词一般4~6个
      • 使用的模型和算法、大家都知道的专业名词、问题的关键词
      • 中间以空格分开

    反面例子:

    image-20230830215701797

    作为一篇失败的论文,这篇论文是成功的,我们可以看到,他对四个问题采用了三种不同的表达方式,直接显示出了巨大的词汇量。接着就是一记中文标点,直接占了好几个位置,真可谓水文是好办法啊。接下来又是一记中文括号,直接干出一大片白色,打算给与评委视觉上的冲击。然后就是数据的列出,一长条数据直接震惊评委,直接让评委垂死病中惊坐起。

  7. 参考文献

    • 引用文献或公开资料都必须按规范列出参考文献并在正文对应处标注
    • 学一下知网如何引用
    • 遇到网上的说得对,但是名气不高的文献,将里面的话用自己的话说一遍就好了,不然引用了别人评委不知道直呼:哪来的野鸡论文hhh

    反面例子:

    image-20230830221107218

    一眼手打,排版还不齐

  8. 制图

    • 基本要求

      • 首先就是能展示自己的思路,还能完美的表现自己的结果
      • 能花里胡哨就花里胡哨,但是前提是不能伤害展示的思路
      • 图的标题要放在下方,且带有编号(表上图下)·注意排版
      • 要无首行缩进,居中对齐
    • 常见的制图软件:

      正面例子:image-20230830221146047

      好看,爱看,会画就多画一点!!!

    线性规划篇

    一句话:有限条件求极值

    • 关键词 题目中提到“怎样安排/分配”“尽量多(少)”“最多(少)”“利润最大”“最合理”等词

      • 生产安排:原材料、设备有限制,总利润最大
        • 生产两种机床,利润分别为XXX,A机器和B机器加工,两种机器工作时间…;怎样安排生产使得总
          利润最大?
      • 投资收益:资产配置、收益率、损失率、组合投资、总收益最大
        • 总资金为M,有n种资产可以配置,平均收益率…,风险损失率.,手续费…,设计组合投资方案使
          得收益尽可能大,总体风险尽可能小
      • 销售运输:产地、销地、产量、销量、运费,总运费最省
        • 商品有m个产地和n个销地,各产地的产量…,各销地需求量….由a产地运到b销地的运价xxx;如何
          调运才能使总运费最省?
      • 车辆安排:路线、起点终点、承载量、时间点、车次安排最合理
        • 不同种类的车辆有各自的承载量,工地里有多条路线,满足用工需求的情况下,如何安排车辆能使
          产量尽可能大?

      matlab用linprog函数就行,具体自查函数用法,懒得写了

    非线性规划篇

    上面的是一次方的,非线性规划篇是高次的

    • 关键词:题目中提到“怎样安排/分配”“尽量多(少)”“最多(少)”“利润最大”“最合理”等词;但变量非一次方

      • 投资规划:资产配置、收益率、损失率、组合投资、总收益率最大/最佳投资方案
        • 总资金为M,有n种资产可以配置,平均收益率.,风险损失率..,手续费..,设计组合投资方案使得收益尽可能大,总体风险尽可能小
      • 角度调整:飞行管理避免相撞;影院最佳视角
        • 飞机位置,速度,进入区域后判定是否相撞,飞机飞行方向角调整的幅度尽量小
        • 电影院视角、仰角影响观影体验,什么位置观影最佳
        • 涉及三角函数,为非线性
      • 生产安排:原材料、设备有限制,总利润最大(目标函数或约束条件含有非线性变量)
        • 生产两种机床,利润分别为XXX,A机器和B机器加工,两种机器工作时间..;成本或利润与某变量的
        • 关系是非线性的,例如A机器每小时生产费用是f = 50x +0.2x^2(元),安排生产使得总利润最大

      函数用fmincon

    最短路径

    函数:graphshortestpath 迪杰斯特拉算法不做过多详细说明

    w=[1,2,3,4]//权重

    DG=sparse([in1,in2,in3,in4],[out1,out2,out3,out4],w)//前面的是入度,后面的是出度

    [dist,path,pred]=graphshortestpath(DG,1,3)//图,起始点,终点

    point_name=[“入度1”,“入度2”,“入度3”,“入度4”]//到时候画图能显示

    h=view(biograph(DG,point_name,“showweights”,“on”))//显示

    edges=getedgsbynodeid(h.Nodes(path),”ID”);

    set(edges,”LineColor”,[1,0,0])//yanse

    set(edges,’LineWidth’,3)//粗细

    最小生成树

普利姆算法和克鲁斯卡尔算法,相当于dfs和bfs