Tabula Rasa：为什么基于树的算法优于神经网络基于树的算法是表格数据的赢家

企业开发 2023-09-18 19:03:26 阅读次数: 0

近年来，人工智能取得了长足的进步。ChatGPT震惊了世界。然而，尽管我们已经看到了图像和文本的令人难以置信的应用程序，但表格数据仍然是一个问题。（以至于Kadra 在 2021 年称它们为神经网络的“不可攻克的城堡”）。但为什么它们仍然是一个问题呢？

本文分为不同的部分。对于每个部分，我们将回答以下问题：

什么是表格数据？
为什么表格数据具有挑战性？
为什么基于决策树的算法在处理表格数据时优于神经网络？
对于表格数据，我们想要什么神经网络？有什么优点？
我们应该如何为表格数据设计算法？
查看文章末尾的参考文献列表，我还提供了一些深化主题的建议。

最后的数据前沿：表格数据

表格数据可以定义为结构化数据的一个子分支。简而言之，表格数据可以定义为任何可以描述为表格（如Excel 工作表）的数据，其中按照惯例，行代表示例，列代表特征。
矛盾的是，尽管它们很简单，但在现实应用中，大多数数据都是表格格式：金融、医学、气候科学和制造。

与图像、文本或音频（称为同类数据，因为它们只有一种类型的特征）相反，表格是异构数据，因为它们可以包含多种类型的特征：

分类值：

猜你喜欢

转载自blog.csdn.net/iCloudEnd/article/details/132962915

Tabula Rasa：为什么基于树的算法优于神经网络基于树的算法是表格数据的赢家

在Java中使用tabula提取PDF中的表格数据

python编程：tabula、pdfplumber、camelot进行表格数据识别

Python：解析PDF文本及表格——pdfminer、tabula、pdfplumber 的用法及对比

【Java】采用 Tabula 技术对 PDF 文件内表格进行数据提取

Python：解析PDF文本及表格——pdfminer、tabula、pdfplumber 的用法及对比 Python：读取 .doc、.docx 两种 Word 文件简述及“Word 未能引发事件”错误

为什么基于树的模型在表格数据任务中比深度学习更优

基于树的查找算法

为什么说卷积神经网络，是深度学习算法应用最成功的领域之一？

遗传算法为什么可以优化bp神经网络？

数据挖掘的的算法，遗传、决策树、粗糙集和神经网络算法介绍

基于BP算法的前馈神经网络

TensorFlow非线性回归--基于神经网络算法

基于图神经网络与深度学习的商品推荐算法

基于 Python 实现的BP神经网络算法【100011188】

基于Excel的神经网络工具箱（之一）——DNN神经网络数据结构的算法实现

余震强度预测能力升级，Nature 刊文认证基于神经网络的模型性能优于传统模型

神经网络算法

Ubuntu 下安装Python2.7, Scrapy, tabula

训练神经网络为什么要把训练数据打乱？

神经网络算法的应用领域,神经网络算法有什么用

bp神经网络模型是什么,bp神经网络是什么算法

分类模型预测，基于遗传算法的神经网络优化---iris数据集

基于循环神经网络的时序数据聚类算法及其并行化

探索Tensorflow2中神经网络算法——基于Mnist数据集（二）

探索Tensorflow2中神经网络算法——基于Mnist数据集（一）

基于PSO粒子群优化的BP神经网络的数据预测算法matlab仿真

基于斑点鬣狗算法的BP神经网络数据预测优化

【Matlab】基于粒子群优化算法优化BP神经网络的数据分类预测

基于Matlab的狼群算法优化BP神经网络数据预测

今日推荐

周排行

Leetcode简单题61~80

解决zookeeper磁盘IO高的问题

多线程相关方法详解

Maven-setting.xml文件详解

Maven 项目的 classpath 理解

渊亭科技大数据笔试题

配置JVM内存分配

计算机网络个人学习笔记（三）网络层：第三部分连载

js中两个等号(==)和三个等号(===)的区别

用C程序自动打开电脑上的程序

每日归档

更多

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)

2024-09-09(0)