第757章 流形学习

    姚梦娜提出的这个问题,对于常浩南来说,不难理解。

    只是很难解决。

    真要说起来的话,这涉及到文本挖掘、数据可视化、信息检索、数据挖掘、机器学习乃至人工智能等一系列问题。

    如果真做到姚梦娜所设想的那样全自动化生产,那就是工业4.0了。

    在1999年这个时间点上,显然不大现实。

    但不可能完全实现这一整套东西,并不意味着其中没有可以作为突破口的部分。

    比如数据挖掘和信息检索,就是千禧年附近很火热的研究方向。

    其核心目的是从海量数据库和大量繁杂信息中提取出有价值的知识,并进一步提高信息的利用率。

    实际上,在常浩南重生之前,飞机设计和制造领域已经开始应用这方面的技术,他本人也接触过不少。

    但当年的他作为一个工科出身的普通技术人员,并没有太多理论功底。

    而系统,则首先需要构建出一个完整且可行的思路出来。

    这就导致如今他脑子里空有一大堆名词,但却不知道哪個是破局的关键——

    实际上,他此时就面临着无法从大量繁杂信息中提取出有价值信息的困境。

    “信息”

    常浩南从旁边扯过一张纸,在纸的最中间写下了两个字。

    在理想化的模型中,最好是一个数据就可以精确且唯一地描述一个含义。

    也就是一维数据。

    小学和中学时候做的应用题,大体上就是这样。

    实际生活中面临的,其实大多数也是这种问题。

    而对于稍复杂一些的情况来说,要完全描述一个含义,往往需要一组数据。

    但与此同时,这一组数据又往往不只能描述这一个含义。

    要想在数学上描述这种一组(多个)数据对应多个含义的现象,就需要将一组数据在不同的维度上进行展开。

    这是由数学理论推向现实的情况。

    而反过来,现实中收集到的信息,在多数情况下,本身就是已经展开过的高维数据。


    而如果想要让计算机处理这些高维数据

    常浩南思索半晌,又在纸上写下了三个基本条件:

    1、对原始高维数据进行压缩,降低原始高维数据的维度,进而节省存储空间,同时也降低高维数据的计算复杂度。

    2、消除,或者至少降低隐藏在原始高维数据中的噪声。

    3、提取到高质量的数据特征,提升后续的数据表示和分类任务的效果。

    他在脑子里把这三条内容过了一下,然后试图让系统给出一个结果。

    没有反应。

    显然,这并不能被算作是“完整且可行”的思路。

    不知不觉间,常浩南就在办公桌前枯坐到了快要吃午饭的时候。

    仍然没能想出一个很好的思路。

    直到一阵来自腹部的叫声把它从深思中吵醒。

    确实有点饿了。

    姚梦娜看了看纸上的一个名词和三句话,也知道常浩南大概是没什么思路,干脆站起身道:

    “要不先去吃个饭?”

    “也好。”

    常浩南不是那种死钻牛角尖的人。

    更何况数学这种东西,光靠俺寻思是寻思不出个一二三的。

    没有灵感,说啥都没用。

    不如先放松一下,换个思路。

    十五分钟后,三人(连同朱雅丹)已经围坐在了食堂二层的一个圆桌旁边。

    这里算是个点餐制的小灶,价格比下面的大食堂贵一些,加上还要多上一层楼,因此来这里吃饭的人并不算多。

    倒是旁边的小超市,来来往往的人流量不少。

    常浩南面前摆着一份热气腾腾的羊汤面,但却并没有急着动筷子,而是出神地看着不远处楼梯口上上下下的人群。

    90年代这会,方便面还属于非常流行的即食类食品。

    常浩南读本科那阵子,大家的条件



第757章 流形学习  
十月廿二推荐:  
随机推荐:  百炼飞升录  太荒吞天诀  白夜浮生录  四重分裂  
‘加入书签,方便阅读’

热门推荐

搜"学霸的军工科研系统"
360搜"学霸的军工科研系统"
语言选择