关于版本控制
什么是版本控制
版本控制是一种记录一个或若干文件内容变化,以便将来查阅特定版本修订情况的系统。 在本书所展示的例子中,我们对保存着软件源代码的文件作版本控制,但实际上,你可以对任何类型的文件进行版本控制。
版本控制系统的变迁
想要做好版本控制,少不了相应的系统,版本控制系统也经历了不少变迁
原始
本地版本控制系统: 用复制整个项目目录的方式来保存不同的版本,或许还会改名加上备份时间以示区别。本地版本控制系统,大多都是采用某种简单的数据库来记录文件的历次更新差异。
进化
集中化版本控制: 为了让不同开发者协同工作,Centralized Version Control Systems
应运而生,诸如 CVS、Subversion
以及 Perforce
等,都有一个单一的集中管理的服务器,保存所有文件的修订版本,而协同工作的人们都通过客户端连到这台服务器,取出最新的文件或者提交更新。
缺点是服务器单点故障。 如果宕机一小时,那么在这一小时内,谁都无法提交更新,也就无法协同工作。 如果磁盘发生损坏,又没有做恰当备份,毫无疑问你将丢失所有数据。
究极进化
分布式版本控制系统:为了解决本地版本控制的单点故障问题,Distributed Version Control System
便横空出世,像 Git、Mercurial、Bazaar 以及 Darcs 等,客户端并不只提取最新版本的文件快照,而是把代码仓库完整地镜像下来。 这么一来,任何一处协同工作用的服务器发生故障,事后都可以用任何一个镜像出来的本地仓库恢复。 因为每一次的克隆操作,实际上都是一次对代码仓库的完整备份。
Git
不仅可以解决单点故障,还有离线提交、快速切换分支、方便合并、更少的仓库污染等特性。 在技术层面上,Git 绝对是一个无中心的分布式版本控制系统,但在管理层面上,我建议你保持一个中心版本库(Origin)
Git 简史
生活中的许多伟大事物一样,Git
诞生于一个极富纷争大举创新的年代。Linux
内核开源项目有着为数众广的参与者。 绝大多数的 Linux
内核维护工作都花在了提交补丁和保存归档的繁琐事务上(1991-2002年间)。 到 2002 年,整个项目组开始启用一个专有的分布式版本控制系统 BitKeeper
来管理和维护代码。到了 2005 年,开发 BitKeeper 的商业公司同 Linux 内核开源社区的合作关系结束,他们收回了 Linux
内核社区免费使用 BitKeeper
的权力。 这就迫使 Linux
开源社区(特别是 Linux
的缔造者 Linux Torvalds
)基于使用 BitKcheper
时的经验教训,开发出自己的版本系统。
他们对新的系统制订了若干目标
- 速度
- 简单的设计
- 对非线性开发模式的强力支持(允许成千上万个并行开发的分支)
- 完全分布式
- 有能力高效管理类似 Linux 内核一样的超大规模项目(速度和数据量)
自诞生于 2005 年以来,Git 日臻成熟完善,在高度易用的同时,仍然保留着初期设定的目标。 它的速度飞快,极其适合管理大项目,有着令人难以置信的非线性分支管理系统
Git 基础
直接记录快照,而非差异比较
与其他版本控制系统不同在于 Git
对待数据的方法。概念上来区分,其它大部分系统以文件变更列表的方式存储信息Git
则不同于上面,Git
更像是把数据看做对小型文件系统的快照,每次你提交更新,或在 Git
中保存项目状态时,它主要对当时的全部文件制作一个快照并保存这个快照的索引。 如果文件没有修改,Git
不再重新存储该文件,而是只保留一个链接指向之前存储的文件。 Git
对待数据更像是快照流
。
近乎所有操作都是本地操作
在 Git
中的绝大多数操作都只需要访问本地文件和资源,因为你在本地磁盘上就有项目的完整历史,所以大部分操作看起来瞬间完成。
Git 保持完整性
Git
中所有数据在存储前都计算校验和,然后以校验和来引用。 这意味着不可能在 Git
不知情时更改任何文件内容或目录内容。
Git 一般只添加数据
在执行的 Git 操作时,几乎只往 Git 数据库中增加数据。 很难让 Git 执行任何不可逆操作,或者让它以任何方式清除数据。
三种状态
Git
有三种状态,已提交(committed
)、已修改(modified
)和已暂存(staged
)。- 工作区(Workspace
)是计算机中项目的根目录
- 工作区(Workspace)是计算机中项目的根目录
- 暂存区(Index)像个缓存区域,临时保存你的改动
- 版本库(Repository)分为本地仓库(Local)和远程仓库(Remote)
几乎所有常用命令就是围绕这几个概念来操作的,一图胜千言,下面是一张比较简单的图,包括了最基本的命令
但只会使用以上命令是不够的,在这个复杂纷繁的程序世界,事情没你想的那么简单,不过有些事情想想就够了,不一定要去做,真要去做你也做不来,比如自己写个git来,但是,更多地的了解git是我们每个程序员都可以做得到的事。再看下图:
下面的命令结合上面两张图来理解、练习、记忆效果更加。暂时用不着的命令记不住,不理解也没关系,哪天遇到问题,再来找找有没有合适的方法也不迟。
Git 常用命令
新建/克隆代码库
|
|
添加/删除文件
|
|
代码提交
|
|
分支操作
|
|
撤销
|
|
标签
|
|
查看日志
|
|
远程同步
|
|
设置
git
的配置文件是.gitconfig
,支持全局配置和项目配置,全部配置对所有项目有效,用 --global
选择指定。
参考资料: