您现在的位置是:首页 > 软件下载 > 系统软件 > 卸载软件 >

OpenRefine V3.4.2 绿色版电脑数据清理大师

OpenRefine V3.4.2

OpenRefine V3.4.2

宝哥软件园为您提供OpenRefine,电脑数据清理大师免费下载,OpenRefine是一款专业的数据清理工具。

软件大小:115.5MB

软件类型:国外软件

软件语言:简体中文

软件授权:演示软件

最后更新:2021-09-03 03:05:07

推荐指数

运行环境:Win7/Win8/Win10/WinALL

查看次数

OpenRefine是一款专业的数据清理工具。数据清理软件的领导者OpenRefine。有了这个软件,用户可以很容易地组织计算机中的所有数据并进行清理。还可以在整台电脑中设置文件夹进行分析,非常方便实用。软件界面简单直观,没有过多的操作功能。可以直观地分析和组织数据。用户只需将选中的文件上传到软件中,即可对数据进行整理和清理;OpenRefine支持查询、过滤、重新强调和分析数据文件的多种功能。软件上的数据文件变成简洁的电子表格,可以以各种格式导出。

软件特征:

1.从计算机上的一个或多个文件导入数据

2.从网络上的一个或多个链接导入数据

3.通过将文本粘贴到剪贴板来导入数据

4.从谷歌云硬盘导入一个或多个表单

5.从数据库导入数据

6.您可以加载任何文件格式

使用方法:

1.完成软件下载,然后单击。并右键单击以创建软件桌面快捷方式

OpenRefine

2.双击软件进入Java下载软件的Java下载界面

OpenRefine

3.双击java.exe文件安装Java文件,并使用OpenRefine软件完成安装

OpenRefine

4.进入软件建立项目界面,从计算机中选择文件进行数据导入

该项目屏幕

项目屏幕(或工作屏幕)是研究项目工作开始的地方。这是您应该熟悉的界面组件的快速练习。

OpenRefine

项目列号

项目栏已设置在项目屏幕的顶部。它包含右边的OpenRefine徽标、项目标题和项目控制按钮。

您可以随时关闭当前项目,然后单击OpenRefine徽标返回主屏幕。如果要在“新浏览器”选项卡或窗口中打开其他项目,可以右键单击徽标,然后使用“在新选项卡中打开”。如果关闭项目,将丢失曲面的当前部分并查看设置(但数据转换将保存在项目历史记录中)。

警告

不要单击浏览器上的“上一步”按钮-它可能会关闭当前项目,并且您将丢失要合并的查看设置。

您可以重命名项目标题中的项目,它将成为一个文本字段。项目名称不一定是唯一的,因为OpenRefine根据幕后的唯一标识符来组织它们。

此固定链接允许您以特定的视图状态(即应用程序设施)返回到项目。此固定链接如果在使用配件和过滤器时必须关闭项目,可以帮助您从最后一站继续工作。它将特定于视图的信息放入URL:单击它可以在现有选项卡中加载此当前视图URL。您可以右键单击并复制固定链接,将当前视图状态复制到剪贴板的网址,而无需刷新正在使用的选项卡。

这将打开.按钮wi

LL打开一个显示创建屏幕的新浏览器标签。在这里,您可以更改设置、启动新项目或打开现有项目。

导出是一个下拉菜单,允许您选择导出数据集的格式。许多导出选项仅导出当前可见的行和记录-当前选定的部分曲面和过滤器,而不是项目中的全部数据。帮助将打开一个新的浏览器选项卡,并将您带到网络上的本用户手册。

网格标题#

网格标题位于项目列和项目网格(项目数据的位置)的下方。网格标题将告诉您项目中行或记录的总数,并指示您是在行模式还是记录模式。

它还显示“180行”或“67个匹配行(总是180个)”,通过部分或过滤查看选定的行。

在较低的数字下,您可以在线路模式和录音模式之间切换。OpenRefine以两种模式永久存储。如果是,默认情况下数据将显示为记录。

行/记录选项的右边是一组选项,用于选择屏幕上有多少行/记录。在屏幕的右侧,您可以一次浏览整个数据集的页面。

扩展#

这个扩展的下拉菜单为您提供了扩展数据的选择——通常是通过将编辑过的语句上传到维基数据,或者导入或导出模式。您可以在维基数据页面了解更多关于这些功能的信息。其他扩展也可以向该下拉菜单添加功能。

网格#

数据集的项目屏幕区域称为网格(或数据网格或项目网格)。网格以表格格式显示数据。对你来说,它看起来像一个普通的电子表格计划。

列宽根据其内容自动设置;您可以删除一些列,但是您可以通过将鼠标悬停在标题上来查看它们。

在每个列标题中,您会看到一个小箭头。单击此箭头将弹出一个下拉菜单,其中包含特定于列的数据浏览和转换选项。您将在“浏览数据”和“转换数据”部分找到每个选项。

每个项目的第一列将始终是标记、添加星号和执行非特定于列的操作的选项。其中所有列也是行/记录号。数字显示线路并记录永久订单;临时排序或部分表面可以重新排列行或显示有限的集合,但除非您进行永久更改,否则数字将显示原始标识符。

项目网格可以显示垂直和水平滚动,这取决于列的数量和宽度以及显示的行数/记录数。您可以使用“排序”和“查看”选项来控制项目网格的显示。

将鼠标悬停在单个单元格上,允许您单独编辑单元格。

面部/过滤器#

这个表面/过滤器选项卡是浏览数据的主要方法之一:显示数据的模式和趋势,并帮助您缩小注意力和修改数据。方面和过滤器更详细地描述了“探索数据”。

OpenRefine

在选项卡中,您将看到三个按钮:刷新、重置所有按钮,然后全部删除。

刷新该工具将确保您查看每种健身方式的最新信息,例如,如果您更改计数或取消某些选项,它将确保您拥有每种健身方式的最新信息。

重置面将删除您可能设置的任何包含或排除配件选项,这些选项将保留在边栏中,但您的视图设置将被撤销。

移除表面将完全移除边栏。如果使用表达式编写自定义方面,这些区域将会丢失。

您可以通过复制以下内容来保留参与方和筛选器:固定链接。

历史记录(退出/红色)#

在OpenRefine中,您可以撤消任何更改数据的更改。最初创建项目时,您将从一开始就跟踪您的更改。用项目的数据保存每个项目的更改历史,因此退出OpenRefine不会删除执行的步骤。当您重新启动OpenRefine时,您可以在退出OpenRefine之前查看和撤消更改。OpenRefine默认自动保存,关闭OpenRefine时每五分钟操作一次(用Ctrl C)。您可以更改此间隔。

导出项目档案时,将保存项目历史记录;当您将归档文件导入到新安装的OpenRefine中时,项目历史记录将被恢复。

OpenRefine

常见问题:

我可以以某种方式持有OpenRefine,这样其他人就可以访问它?

OpenRefine没有针对多用户或多租户场景的内置安全性。OpenRefine数据模型单一,不共享,其他用户覆盖列数据存在风险,用户一定要注意。也就是说,如果你倾向于冒险,你可以使用代理来获得一些安全性。

在这里和这里讨论

同时。

单击后OpenRefine无法启动。它只打开和关闭窗口。

确保系统上安装了Java JRE。至少有1 GB内存可用。

内存不足-感觉很慢-无法为对象保留足够的空间

OpenRefine使用可用的计算机内存高效工作。通常,数据集越大,OpenRefine有效使用它所需的内存就越多。OpenRefine可用的内存量是一个可以根据需要更改的设置。如果遇到“java.lang.outofmoryError”,或者大家普遍认为优化速度慢,可以尝试为OpenRefine分配更多内存。

我有一个问题。我该问哪里?

将您的问题发送到OpenRefine邮件列表。

我发现一个错误或想要一个新的功能。我该怎么办?

考虑第一次讨论邮件列表。这可能有助于获得高质量的错误报告或功能请求,您可以将其提交给问题跟踪器。

我的数据存储在哪里?

OpenRefine项目数据存储在Workspace目录中。第一次运行OpenRefine时,请在本地计算机上设置默认工作区目录,也可以自己设置。有关更多信息,请阅读数据存储?

如何更改我想要改进其项目存储的工作区目录?

在Linux中,如果从终端运行,可以指向-d参数并指向工作区目录,例如。/refine-p 3333-I 0 . 0 . 0 . 0-m 6000m-d/地点/你/想要/工作空间

将这一行添加到Windows上的OpenRefine.l4j.ini文件中,然后保存:

-dre fine . data _ dir=t:\ myoppenrefinedatatafolder

(当然,用实际目录替换t:\ myoppenrefinedafolder)

如何更改OpenRefine使用的IP地址?

在Linux上,在Mac上,从命令行。/refine -i 127.0.0.1。

例如,在Windows上,使用斜线字符,如斜线字符

c:精炼/I 127 . 0 . 0 . 1:808088

如何更改OpenRefine使用的端口?

在Linux上,在Mac上,从命令行。/refine -i 127.0.0.1 -P 3334

例如,在Windows上,使用斜线字符,如斜线字符

c:优化/I 127.0.0.1/p 3334

您也可以编辑refine.ini文件来永久设置IP地址和端口。

我无法通过浏览器连接到OpenRefine。

您可能需要仔细检查您的Chrome或Firefox代理设置。在火狐中,选择选项-高级-网络-连接-设置,然后从“使用系统代理设置”切换到“自动检测代理设置”。

如果您在浏览器中收到消息“网络错误(TCP_ERROR)”,您可以尝试删除“自动检测设置”,并在防火墙规则中添加一个例外,以允许127.0.0.1(或您声明的任何IP)。地址)和OpenRefine)

在Windows上,有时OpenRefine看起来像是开始,但不能以127.0.0.1的形式连接。因此,您可以尝试使用其他IP地址和端口运行OpenRefine。

在西部.

在从机上,您可能会因为某种原因错过适配器-请参考https://github.com/data carpenter/ind refine-ecology-教训/问题/29

OpenRefine语法支持哪些正则表达式?

GREL的正则表达式语法是Java Regex语法,而不是JavaScript的正则表达式语法。请参见grel正则表达式。

您也可以使用Jython Regex代替GREL函数,并使用自定义文本Facade,如下所示:

进口re。

g=re。搜索(美国2014年.*),\ s * bwv ",值)

回到g组(1)

我应该用什么语法和GREL一起正确地构造URL,避免HTTP错误和其他陷阱,比如在URL中使用JSON字符串或者创建超链接?

好的做法是“”精炼表达式“”语法“”加引号,并保留双引号。cupe()获取URL语法,以确保使用您使用的单元格值。

示例:

'https://www.googleapis.com/freebase/v1/mqlread?Query={'mid':null,"/type/object/key ":{ " namespace ":/permission/FMD/model ",value:" " " " " " escape(cell . model name . value," URL ")" } "

=Hyperlink(" http://listings . listhub . net/pages/bhamlsal/' Value "," Value ")"

如何删除一整行或多行?

标记(或添加星号)您将删除。

在所有列的下拉菜单中(标志上方),您可以通过转向设施并按下标志来获得标高。

在开放端,单击“真”选项。

在“所有列”下拉菜单(徽标上方)中,您可以转到“编辑行”“删除所有匹配的行”

如何制作一个有2000多个选项的文字人脸显示器?

您可以访问http://127 . 0 . 0 . 1:3333/preferences并使用preferences键设置部分限制UI。BROWSING.LISTFAT.LIMIT

如何在列中找到重复项?

几个选项:

有一个捷径,门面定制推广面重复门面

在列上创建一个文本表面,然后单击排序依据:计数:COUNT。重复计数的任何部分为2或更多

使用frametcount()函数,(facetcount(值,“值”,“列名”)1)。tostring()并选择true以显示所有重复的行

OpenRefine可以作为更大的Etl管道的一部分?

您可以使用OpenRefine客户端库以编程方式执行OpenRefine。如果您喜欢Docker,您可能会喜欢这种用于批处理的容器方法。

值得注意的是,并非所有细化函数都可以在没有干预的情况下无监督地工作(例如,聚类),但有些函数可以。

以下是一些进一步的讨论和项目:

https://group . Google.com/group/open refine/msg/ee 29 cf 8d 660 e 66 a9?hl=zh-cn。

https://groups . Google.com/group/open refine-dev/browse _ thread/thread/33374842 cfebfcd #

https://github.com/dfhuynh/grefine-proxy.

没有浏览器可以运行OpenRefine吗?什么选择?

在Refine.ini中,您可以添加以下内容:

Java _ options=-drefine . headless=trefine . headless=true

您也可以在运行时使用它来选择头模式-x efine.headless=true。其他参数列于https://github.com/ind refine/open refine/issions/1677 aisuecent-648335037。

Cross()函数对我不起作用

您可能遗漏了一些要执行的步骤,那么您可以使用Cross()函数,并希望它匹配两个项目之间的键。

修剪()您已将键列交叉()

如有必要,在键列中复制数据

导入大文件-“内存使用:100%”

导入大数据文件时,OpenRefine可能会消耗所有可用内存,永远无法完成导入。{{https://imgur.com/stv6vpv.jpeg |内存使用率:100%}}

这可能有助于增加可用内存量。

取消“消除数字、日期、”的单元格对选项也可能有助于导入预览。

关于Python/Jython非法反射访问操作的警告

这可能是因为您没有将java_home环境变量设置为使用java 1.8,例如,Java _ home=c:\ program file \ Java \ JDK-1 . 8 . 0 _ 191。更多详情请参考问题# 1741

如果使用Python 3,就会出现这种情况,因为在使用Jython 2.7.1库之前,我们并不支持Python 3。您必须将默认Python环境设置为Python 2.7才能成功使用OpenRefine。在Windows上,这可以通过临时修改路径环境变量以包括安装Python 2.7而不是Python 3的位置来实现。

软件特色:

辅助功能

OpenRefine是为传统桌面应用程序设计的.只是在浏览器中运行。因此,不幸的是,我们没有投资任何无障碍指南(如WCAG或其他)。我们有很多转词和其他功能的标签,仅此而已。这并不是说我们不会阻止任何人进入并帮助我们做任何看得见的工作,而是因为开放的设计,非常脆弱,无疑更容易进入那些视觉障碍。因为OpenRefine的很多功能最初都是为了让人们判断视觉灵敏度和准确性而设计的。

然而,再一次,如果没有足够的时间和其他人自愿提供专用的代码,每个人都不可能使用OpenRefine的更多功能。

打开的项目无法正常工作,或者在浏览器中显示混合的HTML内容

这可能是因为您已经在OpenRefine的AppData文件夹中安装了OpenRefine扩展,这也是工作区的默认位置,并保留了项目文件夹和文件。因此.我们不想移除OpenRefine扩展来解决问题的风险,所以.让我们按顺序执行以下步骤:

备份AppData文件夹下的OpenRefine文件夹。(使用Windows上的zip或任何存档工具(如7z),然后移动这个。压缩文件到安全位置或云中的位置)

删除AppData文件夹下的OpenRefine文件夹。

OpenRefine已启动,它将重新创建文件夹和工作区文件夹。

可选的下一步是从先前保存的中选择Workspace.json文件和项目文件夹。压缩备份文件,并有选择地返回到原始位置。

OpenRefine V3.4.2 绿色版电脑数据清理大师下载地址

OpenRefine V3.4.2:
暂不提供下载

OpenRefine类似的软件

相关教程

猜你喜欢