分类目录归档:软件

Zotero快速入门

1 介绍与安装

Zotero是一个免费开源的研究管理软件,收集、管理、引用和分享你的研究资料,其开源社区活跃,拥有大量有趣而实用的插件,很适合有论文阅读或科研需求的学生群体和科研人员。

由于Zotero的前身是一款浏览器插件

Read more

2022年Obsidian新玩法总结

1 版本更新简记

注意1:细节调整、bug修复、开发者相关、同步与发布相关的更新会被忽略

注意2:本页面主要针对obsidian进行功能说明,部分内容显示可能在网页端存在异常

  • v0.13.18(更新日期 Jan 3, '22 8:08 AM),增加多个快捷键(全局搜索/替换、创建新笔记),代码块预览界面右上角增加复制按钮
  • v0.13.25(更新日期 Feb 19, '22 2:42

Read more

notebook 常用技巧

1 常用快捷键

  • Ctrl-Enter : 运行本单元
  • Ctrl-/:注释整行/撤销注释(仅代码状态有效)
  • Tab : 代码补全或缩进
  • Shift-Tab : 提示(输出帮助信息,部分函数、类、方法等会显示其定义原型,如果在其后加 ? 再运行会显示更加详细的帮助)

更多快捷键及其说明可参阅5 快捷键 可以自行打开Jupyter Notebook在非编辑模式下,按H键查看所有快捷键

2 常用Magic关键字

  1. 每个notebook都适用的三行命令
%matplotlib inline # 设定画图结果的自动

Read more

Kettle快速入门

1 Kettle简介

Kettle是一款由纯Java语言开发的免费开源的ETL工具

  • ETL即Extract(数据抽取)、Transform(数据转换)、Load(数据加载)
  • Kettle 可以在Window、Linux、Unix上运行,绿色无需安装
  • 支持各种主流数据库,并提供了图形化的用户界面
  • Kettle 中文名是水壶,水壶将汇总不同来源或格式的数据,然后以指定的格式流出
  • Kettle 商业化以后,改名为Pentaho,Pentaho是指一系列数据集成、分析及报表工

Read more

Minio基本介绍

1 Minio

MinIO是一个用Golang开发的开源分布式对象存储服务

特性:

  • 兼容亚马逊S3云存储服务接口
  • 非常适合于存储大容量非结构化的数据,例如图片、视频、日志文件、备份数据和容器/虚拟机镜像等,而一个对象文件可以是任意大小,从几kb到最大5T不等
  • 使用纠删码erasure code和校验和checksum来保护数据免受硬件故障和数据损坏

分布式Minio可以让你将多块硬盘(甚至在不同的机器上)组成一个对象存储服务。由于硬盘分布在不同

Read more

AmazonS3基本介绍

1 AWS S3基础

AWS S3 全名是 Simple Storage Service,简单存储服务。

基本特性:

  • 提供了统一的接口 REST/SOAP 来统一访问任何数据
  • 对 S3 来说,存在里面的数据就是对象名(键),和数据(值)
  • 不限量,单个文件最高可达 5TB
  • 高速。每个 bucket 下每秒可达 3500 PUT/COPY/POST/DELETE 或 5500 GET/HEAD 请求
  • 具备版本,权限控制能力
  • 具备数据生命周期管理能力

常用场景:

Read more

Git常用技巧

1 git pull 下拉分支

拉取data_utility下icu分支,命令:

git clone -b icu https://github.com/xingqiuxia/data-utility.git

报错:Error:RPC failed; result=35, HTTP code = 0

  • 原因是git

Read more

Git快速入门

1 Git定义

Git 是一个开源的分布式版本控制系统,用于敏捷高效地处理各种项目。

因为传统的集中式版本控制系统(CVS和SVN)不好用,再加上Linux社区不小心跟BitKeeper(为Linux免费提供版本控制服务的供应商)闹翻了,于是Linus直接用C开发了一个分布式版本控制系统,为程序员的世界提供了一片新天地~

  • workspace:工作区
  • staging area:暂存区/缓存区
  • local repository:版本库或本地仓库
  • remote repository:远程仓库

2 Git安装配置

# De

Read more

2.ElasticSearch基础操作

1 增删改查CURD

1.1 索引的CURD

1)新增

# 创建索引名为 tehero_index 的索引
PUT /tehero_index?pretty
{
# 索引设置
  "settings": {
    "in

Read more

1.ElasticSearch基本概念

1 ES简介

Elasticsearch 是一款开源的全文搜索与分析引擎,它拥有高扩展、大容量数据的存储和处理特性,有着近乎实时的处理效果。elasticsearch 的使用场景还是比

Read more