- 数据类型
- 基本统计
- 协同过滤
- 分类和回归
- 聚类
- 最优化算法
- 降维
- 特征抽取和转换
- 特征抽取
- 特征转换
- Tokenizer
- StopWordsRemover
- n-gram
- Binarizer
- PolynomialExpansion
- Discrete Cosine Transform (DCT)
- StringIndexer
- IndexToString
- OneHotEncoder
- VectorIndexer
- Normalizer(规则化)
- StandardScaler(特征缩放)
- MinMaxScaler
- MaxAbsScaler
- Bucketizer
- ElementwiseProduct(元素智能乘积)
- SQLTransformer
- VectorAssembler
- QuantileDiscretizer
- 特征选择