本文作者:sukai

步步惊魂剧情介绍素材(步步惊魂演员介绍)

sukai 04-17 111

  

  工欲善其事

  R与RStudio简介及相关软件资源(下)

  1F

  基础设置

  一、工作目录设置

R 默认读入和写出的数据对象都存储在当前工作目录(working directory)中。若要读入其他目录中对象,则需要指定工作路径。一般而言,开始某个数据分析项目时,即可新建一个目录并将其设定为当前工作目录。此后所有的数据对象均储存其中。

对使用中文操作系统的分析者而言,为避免因汉字编码问题而在读入文件和分析数据时发生莫名的错误,首先需要明确一条基本命名规则:R 中的目录名和文件名不能有中文,也不要出现除中划线 - 和下划线 _ 之外的特殊字符,而只使用英文字母、数字以及 - 和 _ 的组合。

对普通用户而言,建议在非系统盘(如 D 盘、E 盘等)的根目录下建立数据分析目录。创建新目录可直接在操作系统中进行,也可在 R 中使用命令dir.create(" ")建立新目录," "中输入路径名和目录名,例如:

此时即可在 D 盘根目录下找到名为 R2017 的目录。

注意:R 中的路径分隔符为正斜杠(forward slash)/,而不是反斜杠(backward slash)。正反斜杠的译法多少有些令人费解,不妨取名为撇斜杠(/)和捺斜杠(),更适合中国人的理解方式。

如目录已创建,可通过命令setwd()将该目录设为当前工作路径,例如:

其中wd即 working directory 的首字母缩写。

R 路径名中的撇斜杠/也可写成双捺斜杠的形式,如:

设置完毕后,可通过getwd()命令查看当前工作路径,此时括号中不需要填入任何内容。

  二、语言选项设置

也许你已注意到前面提示中出现了“程辑包”而不是“程序包”这种古怪的翻译。这是因为 R 的相关中文提示最早并非由中国大陆人士翻译所致。实际上,按照其默认的中文提示(如错误提示)进行网络搜索,通常不能找到很好的资源。这一方面是由于翻译质量与翻译习惯问题,另一方面是由于国内的中文 R 社区在活跃度和技术水平上与国外的成熟社区还有较大距离。因此,安装完 R 后的第一项设置,可考虑修改默认语言选项,将其设为英文。

若想使修改后的语言选项仅对此次打开的 R 有效,可使用如下命令:

Sys.setenv()是修改环境变量函数,LANG表示语言(language),en表示英语(English)。这样在将来出现错误提示时,可使用搜索引擎检索到相关解答资源。注意应当使用英文搜索引擎来搜索英文资源,以提高效率。

这种做法的劣势在于关闭 R 而重新打开后,其默认语言选项仍是中文。严格来说,这并不是 R 本身的设置,而是它默认采用 Windows 系统的默认语言。对于大陆人士而言,其所使用的 Windows 操作系统通常默认语言为中文,因此 R 会使用中文提示。为一劳永逸地改变此版本下的 R 的默认语言,可采用如下方式:

找到安装路径下etc文件夹中的Rconsole文件。如选择默认安装方式,R 通常安装在 C 盘的 Program Files 目录下。以本人写作此文档时的 R 版本为例,其路径为:C:Program FilesRR-3.4.2etc。

用文本编辑器打开Rconsole文件。建议安装Notepad++(见文末注解)软件而不是使用 Windows 自带的记事本软件打开。找到以下文字:

## Language for messages

  language =

通常来说,=号后面默认是空白,以便调用 Windows 的默认语言。在 =后填入指定的语言缩写,保存修改后关闭该文档,即可永久性修改默认语言设置。例如:

## Language for messages

  language = en

其中en就表示 English 。保存后关闭(Windows 系统可能会提醒需要管理员权限方可修改,点击确定),重新打开 R ,应当可以看到所 有提示文字已变为英文:

  

实际上,对有经验的Windows用户来说,设置 R 的默认语言为英文的最简便方式是在安装 R 时,出现Select Components对话框后,将里面出现的Message Translation选项前面默认出现的勾去掉,即可保证界面和提示语言为英文。你不妨在安装新版本的 R 时尝试这种方法。

最后提醒:使用 R ,即意味着基本告别中文操作与提示。请尽快熟练英文环境下的相关操作,这对提升 R 的使用效率至为关键。

  2F

  RStudio 安装与设置

  一、RStudio 简介

R 虽然是个强大的统计分析软件,但仍欠缺完成数据分析的整体流程所需要的衍生功能。例如,如何满足普通用户对友好操作界面的需求,如何生成可重复、交互性的报告(Word 格式、HTML 格式或其他格式)并与他人共享,如何快速导入其他类型的数据(如 Excel、SPSS、Stata、SAS 等常用数据管理与分析软件格式的数据),等等。这就需要一个更具整合性的操作平台,以更有效率和对普通用户更友好的方式完成数据分析、报告撰写、成果发布等工作。

RStudio 就是一个优秀的 R集成开发环境(见文末注解)。它集成了 R、带语法高亮和命令补全的代码编辑器、画图工具、代码调试工具等工作环境,同样提供 Windows、Mac 和 Linux 版本,同时具有免费的开源版本和付费的商业版本供用户选择。个人用户或普通用户选择免费版本即可,具有更高要求的企业用户或高级用户可选择商业版本。RStudio 的开发始于2010年,2011年2月发布测试版,2016年发布1.0.0版本。截止2017年10月,已发布至1.1版本。此后介绍均以 RStudio 1.0.0之后的版本为基础进行演示。

RStudio 的核心团队包括以首席科学家 Hadley Wickham为代表的其他数据科学家和软件工程师,他们是驱动 R 与数据科学进一步发展和推广的活跃力量,其所开发的诸多 R 包已成为数据分析的最常用工具。

RStudio 可从其官网选择对应系统的版本下载安装。安装选择默认选项即可,注意一般应在安装完 R 后再安装 RStudio。

  二、RStudio 调试

1. 布局与功能

左上角的命令区,用来编辑、粘贴命令,窗口上部的小图标是较为常用的几个功能,如保存(Save current document)、Knit(Knit 功能可根据数据处理结果生成所需格式的文档,如 HTML、PDF、Word 等。)、运行(Run);

左下角的控制区(console)(控制区显示脚本运行结果,亦可直接输入命令,回车运行。);

右下角的功能区,依次为 Files(打开本地文件)、Plots(显示图形结果)、Packages(包的相关功能)、Help(帮助)、Viewer五个功能;

右上角的Environment与History,分别用来对数据与已运行的命令进行显示和操作。

  

2. 新建文档类型

在File菜单下的New File子菜单里可看到所有可新建文档类型,点击R 可新建一个空白文档,此外还有 R Notebook、R Markdown、C++ File 文档等。

  

3.数据导入

通过File菜单下的Import Dataset即可进行数据的导入,可导入 CSV、Excel、SPSS、SAS、Stata 五种格式的文件。导入的文件会在命令区以新窗口的形式呈现。

  

4. 包的更新

软件使用中经常会有 R 包的更新,可以通过Tools菜单下的Check For Updates功能检查待更新的 R 包,也可以直接点击右下角Packages功能区的Update按钮,功能相同。

  

5. 默认文本编码格式

为了避免打开数据文件时中文变成乱码,需要修改默认文本编码格式,点击Tools菜单下的Global Options子菜单,在弹出窗口中点击Code中的Saving,将默认文本编码格式(Default text coding)修改为UTF-8(见文末注解)。当打开中文数据时在File--Reopen with Ecoding下选择 UTF-8 格式就可以正常显示中文。

  

6. 速查表

为方便 RStudio 的使用,Help菜单内设置了Cheatsheet提供速查功能,使用者也可以通过Help下Markdown Quick Reference功能迅速入门 Markdown 语法。

  

对初级用户而言,RStudio 的最初调试只涉及Tools菜单下的Global Options子菜单。

  

打开后,在General选项中可选择与 RStudio 相关联的 R 版本(如果只安装了一个版本的 R,此步骤可忽略),还可设定当前工作目录(working directory)。

  

当前工作目录的设置非常重要,稍后继续说明。在Appearance选项中可选择字体、字号和背景颜色,可自行尝试调整到个人觉得舒适的配置。

  

步步惊魂剧情介绍素材(步步惊魂演员介绍)

  三、RStudio 功能简介

为确保能实现 RStudio 的诸多拓展功能,请确保已执行以下命令安装各相关包。

其中,knitr 包和 rmarkdown 包可用来将 Rmarkdown 文档转为 HTML 网页、Word 文件或 PDF 文件;bookdown 包可用来撰写 Markdown 格式的长文档(书稿)并转为 HTML 网页、Word 文件或 PDF 文件;xaringan 可用来制作 HTML5 格式的网页幻灯片;shiny 包可用来制作交互式的网页。

安装完毕这些包后,打开 RStudio,点击左上角的新建空白文档图标的向下箭头,可以看到可供选择的新建文档格式包括 R 、R Notebook、R Markdown 等。一般可选择 R Markdown 为基本文档格式。以下如无特殊说明,均以此格式为准进行演示。

如想观察数据,可键入如下命令:

此时左上方窗口会出现数据结构示意,并可执行数据排序(点击变量名称中的上下箭头按钮)、筛选(点沙漏形状的Filter按钮)等简单功能。

  

  四、RStudio 中的常用快捷键

要想流畅运用 RStudio,常用快捷键的使用是必不可少的。下面列举几个较常用的快捷键。

  

在RStudio内可通过工具栏Help/Tools--Keyboard Shortcuts Help或快捷键 Alt+Shift+K 来查看所有快捷键。

  

按任意键可退出此屏幕。

注解:

1.Notepad++ 也是一个免费的自由开源软件。之所以推荐使用它而不是Windows自带的记事本,原因比较复杂,涉及计算机的字符编码问题,暂不必深究。仅了解一点即好:如有可能,Windows 平台下尽可能使用 Notepad++ 而不是其自带的记事本软件创建或修改文本文件。若是 Mac 系统,可使用 Sublime 软件或其他开源文本编辑器打开。

2.集成开发环境(Integrated Development Environment,IDE)软件是用于程序开发的应用程序,一般包括代码编辑器、编译器、调试器和图形用户界面工具,集成了代码编写、分析、编译、调试、建模等功能的一体化开发软件套。

3.UTF-8(8-bit Unicode Transformation Format)又称万国码,由Ken Thompson于1992年创建,用在网页上可以统一页面显示中文简体繁体及其它语言。

编辑:潘雨 张柏杨

· · · · · ·

阅读
分享