Spark机器学习(影印版) 东南大学出版社 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
Spark机器学习(影印版) 东南大学出版社电子书下载地址
- 文件名
- [epub 下载] Spark机器学习(影印版) 东南大学出版社 epub格式电子书
- [azw3 下载] Spark机器学习(影印版) 东南大学出版社 azw3格式电子书
- [pdf 下载] Spark机器学习(影印版) 东南大学出版社 pdf格式电子书
- [txt 下载] Spark机器学习(影印版) 东南大学出版社 txt格式电子书
- [mobi 下载] Spark机器学习(影印版) 东南大学出版社 mobi格式电子书
- [word 下载] Spark机器学习(影印版) 东南大学出版社 word格式电子书
- [kindle 下载] Spark机器学习(影印版) 东南大学出版社 kindle格式电子书
寄语:
新华书店正版,关注店铺成为会员可享店铺专属优惠,团购客户请咨询在线客服!
内容简介:
你可以从书中学到使用Scala、Java和Python创建你的靠前个Spark程序;在你自己的计算机以及AmazonEC2上建立、配置Spark开发环境;访问公共机器学习数据集,使用Spark载入、处理、清理、转换数据;使用Spark的机器学习库来实现能够利用各种熟知的机器学习模型的程序;等等。
书籍目录:
Preface
Chapter 1: Getting Up and Running with Spark
Installing and setting up Spark locally
Spark clusters
The Spark programming model
Spark Context and Spark Conf
The Spark shell
Resilient Distributed Datasets
Creating RDDs
Spark operations
Caching RDDs
Broadcast variables and accumulators
The first step to a Spark program in Scala
The first step to a Spark program in Java
The first step to a Spark program in Python
Getting Spark running on Amazon EC2
Launching an EC2 Spark cluster
Summary
Chapter 2: Designing a Machine Learning System
Introducing Movie Stream
Business use cases for a machine learning system
Personalization
Targeted marketing and customer segmentation
Predictive modeling and analytics
Types of machine learning models
The components of a data—driven machine learning system
Data ingestion and storage
Data cleansing and transformation
Model training and testing loop
Model deployment and integration
Model monitoring and feedback
Batch versus real time
An architecture for a machine learning system
Practical exercise
Summary
Chapter 3: Obtaining, Processing, and Preparing Data with Spark
Accessing publicly available datasets
The Movie Lens lOOk dataset
Exploring and visualizing your data
Exploring the user dataset
Exploring the movie dataset
Exploring the rating dataset
Processing and transforming your data
Filling in bad or missing data
Extracting useful features from your data
Numerical features
Categorical features
Derived features
Transforming timestamps into categorical features
Text features
Simple text feature extraction
Normalizing features
Using MLlib for feature normalization
Using packages for feature extraction
Summary
Chapter 4: Building a Recommendation Engine with Spark
Types of recommendation models
Content—based filtering
Collaborative filtering
Matrix factorization
Extracting the right features from your data
Extracting features from the MovieLens 100k dataset
Training the recommendation model
Training a model on the MovieLens 100k dataset
Training a model using implicit feedback data
Using the recommendation model
User recommendations
Generating movie recommendations from the MovieLens 100k dataset
Item recommendations
Generating similar movies for the MovieLens 100k dataset
Evaluating the performance of recommendation models
Mean Squared Error
Mean average precision at K
Using MLlib's built—in evaluation functions
RMSE and MSE
MAP
Summary
Chapter 5: Building a Classification Model with Spark
Types of classification models
Linear models
Logistic regression
Linear support vector machines
The na'fve Bayes model
Decision trees
Extracting the right features from your data
Extracting features from the Kaggle/StumbleUpon evergreen classification dataset
Training classification models
Training a classification model on the Kaggle/StumbleUpon evergreen classification dataset
Using classification models
Generating predictions for the Kaggle/StumbleUpon
evergreen classification dataset
Evaluating the performance of classification models
Accuracy and prediction error
Precision and recall
ROC curve and AUC
Improving model performance and tuning parameters
Feature standardization
Additional features
Using the correct form of data
Tuning model parameters
Linear models
Decision trees
The naive Bayes model
Cross—validation
Summary
Chapter 6: Buildin a Regression Model with Spark
Types of regression models
Least squares regression
Decision trees for regression
Extracting the right features from your data
Extracting features from the bike sharing dataset
Creating feature vectors for the linear model
Creating feature vectors for the decision tree
Training and using regression models
Training a regression model on the bike sharing dataset
Evaluating the performance of regression models
Mean Squared Error and Root Mean Squared Error
Mean Absolute Error
Root Mean Squared Log Error
The R—squared coefficient
Computing performance metrics on the bike sharing dataset
Linear model
Decision tree
Improving model performance and tuning parameters
Transforming the target variable
Impact of training on log—transformed targets
Tuning model parameters
Creating training and testing sets to evaluate parameters
The impact of parameter settings for linear models
The impact of parameter settings for the decision tree
Summary
Chapter 7: Building a Clustering Model with Spark
Types of clustering models
K—means clustering
Initialization methods
Variants
Mixture models
Hierarchical clustering
Extracting the right features from your data
Extracting features from the MovieLens dataset
Extracting movie genre labels
Training the recommendation model
Normalization
Training a clustering model
Training a clustering model on the MovieLens dataset
Making predictions using a clustering model
Interpreting cluster predictions on the MovieLens dataset
Interpreting the movie clusters
Evaluating the performance of clustering models
Internal evaluation metrics
External evaluation metrics
Computing performance metrics on the MovieLens dataset
Tuning parameters for clustering models
Selecting K through cross—validation
Summary
Chapter 8: Dimensionality Reduction with Spark
Types of dimensionality reduction
Principal Components Analysis
Singular Value Decomposition
Relationship with matrix factorization
Clustering as dimensionality reduction
Extracting the right features from your data
Extracting features from the LFW dataset
Exploring the face data
Visualizing the face data
Extracting facial images as vectors
Normalization
Training a dimensionality reduction model
Running PCA on the LFW dataset
Visualizing the Eigenfaces
Interpreting the Eigenfaces
Using a dimensionality reduction model
Projecting data using PCA on the LFW dataset
The relationship between PCA and SVD
Evaluating dimensionality reduction models
Evaluating k for SVD on the LFW dataset
Summary
Chapter 9: Advanced Text Processing with Spark
What's so special about text data?
Extracting the right features from your data
Term weighting schemes
Feature hashing
Extracting the TF—IDF features from the 20 Newsgroups dataset
Exploring the 20 Newsgroups data
Applying basic tokenization
Improving our tokenization
Removing stop words
Excluding terms based on frequency
A note about stemming
Training a TF—IDF model
Analyzing the TF—IDF weightings
Using a TF—IDF model
Document similarity with the 20 Newsgroups dataset and
TF—IDF features
Training a text classifier on the 20 Newsgroups dataset
using TF—IDF
Evaluating the impact of text processing
Comparing raw features with processed TF—IDF features on the
20 Newsgroups dataset
Word2Vec models
Word2Vec on the 20 Newsgroups dataset
Summary
Chapter 10: Real—time Machine Learning withSpark Streaming
Online learning
Stream processing
An introduction to Spark Streaming
Input sources
Transformations
Actions
Window operators
Caching and fault tolerance with Spark Streaming
Creating a Spark Streaming application
The producer application
Creating a basic streaming application
Streaming analytics
Stateful streaming
Online learning with Spark Streaming
Streaming regression
A simple streaming regression program
Creating a streaming data producer
Creating a streaming regression model
Streaming K—means
Online model evaluation
Comparing model performance with Spark Streaming
Summary
Index
作者介绍:
彭特里思,如果你是一名Scala、Java或Python开发人员,对机器学习和数据分析饶有兴趣,并热衷于学习如何使用spa rk框架将常见机器学习技术运用干大规模应用,那么这本书就是写给你的。如果对spark有基本的理解自然会有益处,但这并不是必需的。
出版社信息:
暂无出版社相关信息,正在全力查找中!
书籍摘录:
暂无相关书籍摘录,正在全力查找中!
在线阅读/听书/购买/PDF下载地址:
原文赏析:
在信息检索中,准确率通常用于评价结果的质量,而召回率用来评价结果的完整性。
通常,准确率和召回率是负相关的,高准确率常常对应低召回率,反之亦然。
准确率和召回率在单独度量时用处不大,但是它们通常会被一起组成聚合或者平均度量。二者也同时依赖于模型中选择的阈值。
现代的大数据场景包含如下需求:比如能与系统的其他组件整合,尤其是数据的收集和存储系统、分析和报告以及前端应用;易于扩展且与其他组件相对独立..;.. 最好能同时支持批处理和实时处理。
个性化和推荐十分相似,但推荐通常专指向用户显式地呈现某些产品或是内容,而个性化有时偏向隐式。比如说,对 MovieStream 的搜索功能个性化,以根据该用户的数据来改变搜索结果。
对数据进行初步预处理之后,需要将其转换为一种适合机器学习模型的表示形式。对许多模型类型来说,这种表示就是包含数值数据的向量或矩阵。
其它内容:
书籍介绍
Apache spark是一款全新开发的分布式框架,特别对低延迟任务和内存数据存储进行了优化。它结合了速度、可扩展性、内存处理以及容错性,是极少数适用于并行计算的框架之一,同时还非常易于编程,拥有一套灵活、表达能力丰富、功能强大的API设计。
《Spark机器学习(影印版 英文版)》指导你学习用于载入及处理数据的spark APl的基础知识,以及如何为各种机器学习模型准备适合的输入数据:另有详细的例子和实际生活中的真实案例来帮助你学习包括推荐系统、分类、回归、聚类、降维在内的常见机器学习模型,你还会看到如大规模文本处理之类的高级主题、在线机器学习的相关方法以及使用spa rk st reami ng进行模型评估。
网站评分
书籍多样性:3分
书籍信息完全性:7分
网站更新速度:5分
使用便利性:9分
书籍清晰度:7分
书籍格式兼容性:5分
是否包含广告:3分
加载速度:4分
安全性:9分
稳定性:4分
搜索功能:5分
下载便捷性:7分
下载点评
- 少量广告(312+)
- 无广告(91+)
- 好评多(612+)
- 内涵好书(678+)
- 品质不错(627+)
- txt(643+)
- 书籍完整(177+)
下载评价
- 网友 冯***卉:
听说内置一千多万的书籍,不知道真假的
- 网友 居***南:
请问,能在线转换格式吗?
- 网友 利***巧:
差评。这个是收费的
- 网友 康***溪:
强烈推荐!!!
- 网友 敖***菡:
是个好网站,很便捷
- 网友 曾***玉:
直接选择epub/azw3/mobi就可以了,然后导入微信读书,体验百分百!!!
- 网友 隗***杉:
挺好的,还好看!支持!快下载吧!
- 网友 詹***萍:
好评的,这是自己一直选择的下载书的网站
- 网友 芮***枫:
有点意思的网站,赞一个真心好好好 哈哈
- 网友 相***儿:
你要的这里都能找到哦!!!
- 网友 石***致:
挺实用的,给个赞!希望越来越好,一直支持。
- 网友 养***秋:
我是新来的考古学家
- 网友 丁***菱:
好好好好好好好好好好好好好好好好好好好好好好好好好
喜欢"Spark机器学习(影印版) 东南大学出版社"的人也看了
The Oxford Dictionary of Modern Slang 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
中国历史纪年表 中华书局 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
基于数据分析的网络安全(影印版第2版)(英文版) 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
印刷概论(第二版) 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
期货基础知识考试辅导习题集 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
经济学基础(第5版)/“十二五”职业教育国家规划教材 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
百变校巴思维游戏书 第2辑 迷宫大冒险 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
读懂小学生 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
迪士尼魔法立体翻翻书:冰雪奇缘 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
色彩高分卷(2015年版) 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
- 卫生统计基础与护理科研 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
- 企鹅杜比的自然课堂(全3册) 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
- 【预售】Fossils From Lost Worlds,来自失落世界的化石 儿童故事绘本 青少年读物 英文原版图书籍进口正版 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
- 天津 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
- 隐蔽的秩序 吴思 著 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
- 重点大学自主招生数学备考全书——重点大学自主招生真题(上) 甘志国 哈尔滨工业大学出版社 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
- 星火英语·2013考研英语词汇星火式巧记速记(合订本) 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
- 中国音乐家协会社会音乐水平考试教材:流行音乐声乐考级歌曲集(男声) 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
- 中医内科学案例教学 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
- 营业税改征增值税实战操作(政策讲解·财税处理·风险控制·疑难解答) 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
书籍真实打分
故事情节:4分
人物塑造:6分
主题深度:3分
文字风格:4分
语言运用:3分
文笔流畅:4分
思想传递:7分
知识深度:9分
知识广度:6分
实用性:7分
章节划分:5分
结构布局:4分
新颖与独特:6分
情感共鸣:3分
引人入胜:5分
现实相关:5分
沉浸感:9分
事实准确性:3分
文化贡献:6分