操作系统|1@leeon | 分享未来 - 互联网技术

Apr27

【原创】ESXI 6.7自动关机设置

Author: leeon Click: 23794 Comments: 0 Category: 操作系统 Tag: vmware,esxi

楼主最近配置了一台32G内存的微塔来做虚拟化服务的学习和搭建，使用esxi来跑虚拟化平台。每天定时开机可以通过wake on lan来实现，但是定时esxi的定时关机是没有直接的解决方案来实现的，因此我们只能通过连入esxi的ssh终端来实现。

本质上esxi就是一台linux的，可以执行定时脚本。但是当esxi重启后配置的信息会自动丢失，因此我们需要按照如下步骤来完成设置。

1. 首先在esxi 6.7上开启ssh

2. 然后通过ssh终端登录上去，用户名root，密码就是你安装esxi设置的root密码。

3. 在/vmfs/volumes/datastore1 目录下创建一个自动关机脚本文件：poweroff.sh ，同时设置755权限

4. 在poweroff.sh文件中写入如下信息：

[code="bash"]
#!/bin/sh
/sbin/poweroff
[/code]

5. 接着编辑/etc/rc.local.d/local.sh 文件，在其文件文本末尾的"exit 0" 之前填入如下信息：

[code="bash"]
/bin/kill $(cat /var/run/crond.pid)

/bin/echo '58 12 * * * /vmfs/volumes/datastore1/poweroff.sh' >> /var/spool/cron/crontabs/root

/usr/lib/vmware/busybox/bin/busybox crond
[/code]

最终效果如下：

6 这里写入的三行内容是为了在esxi启动后将cron设定的信息写入到crontab的配置文件中。并重启cron进程。注意cron的时间设定，esxi的底层时间全部是utc时间，因此我们在设定时间一定不能用我们中国时区的时间，将需要设定重启的时间减去8小时才是UTC时间。例如我们完成23:00关键，那么我们的cron时间设定为“0 15 * * *”。

7.最后我们需要执行以下 auto-backup.sh 脚本，这个是esxi自带的命令，直接执行即可。

8.如果你要立即生效你的cron设定，那么就执行下/etc/rc.local.d/local.sh 脚本就好了。

Feb28

【转载】System Dump与Core Dump的区别

Author: leeon Click: 12125 Comments: 0 Category: 操作系统 Tag: systemdump,coredump

许多没有做过UNIX系统级软件开发的人士，可能只听说过Dump，而并不知道系统Dump和Core Dump的区别，甚至混为一谈。

系统Dump（System Dump）

所有开放式操作系统，都存在系统DUMP问题。

产生原因：
由于系统关键/核心进程，产生严重的无法恢复的错误，为了避免系统相关资源受到更大损害，操作系统都会强行停止运行，并将当前内存中的各种结构、核心进程出错位置及其代码状态，保存下来，以便以后分析。最常见的原因是指令走飞，或者缓冲区溢出，或者内存访问越界。走飞就是说代码流有问题，导致执行到某一步指令混乱，跳转到一些不属于它的指令位置去执行一些莫名其妙的东西（没人知道那些地方本来是代码还是数据，而且是不是正确的代码开始位置），或者调用到不属于此进程的内存空间。写过C程序及汇编程序的人士，对这些现象应当是很清楚的。

系统DUMP生成过程的特点：
在生成DUMP过程中，为了避免过多的操作结构，导致问题所在位置正好也在生成DUMP过程所涉及的资源中，造成DUMP不能正常生成，操作系统都用尽量简单的代码来完成，所以避开了一切复杂的管理结构，如文件系统、LVM等等，所以这就是为什么几乎所有开放系统，都要求DUMP设备空间是物理连续的——不用定位一个个数据块，从DUMP设备开头一直写直到完成，这个过程可以只用BIOS级别的操作就可以。这也是为什么在企业级UNIX普遍使用LVM的现状下，DUMP设备只可能是裸设备而不可能是文件系统文件，而且[b]只[/b]用作DUMP的设备，做 LVM镜像是无用的——系统此时根本没有LVM操作，它不会管什么镜像不镜像，就用第一份连续写下去。

所以UNIX系统也不例外，它会将DUMP写到一个裸设或磁带设备。在重启的时候，如果设置的DUMP转存目录（文件系统中的目录）有足够空间，它将会转存成一个文件系统文件，缺省情况下，[b]对于AIX来说是/var/adm/ras/下的vmcore*这样的文件，对于HPUX来说是 /var/adm/crash下的目录及文件。[/b]
当然，也可以选择将其转存到磁带设备。

会造成系统DUMP的原因主要是：
系统补丁级别不一致或缺少、系统内核扩展有BUG（例如Oracle就会安装系统内核扩展）、驱动程序有 BUG（因为设备驱动程序一般是工作在内核级别的），等等。所以一旦经常发生类似的系统DUMP，可以考虑将系统补丁包打到最新并一致化、升级微码、升级设备驱动程序（包括FC多路冗余软件）、升级安装了内核扩展的软件的补丁包等等。

进程Core Dump

进程Core Dump产生的技术原因，基本等同于系统DUMP，就是说从程序原理上来说是基本一致的。

但进程是运行在低一级的优先级上（此优先级不同于系统中对进程定义的优先级，而是指CPU代码指令的优先级），被操作系统所控制，所以操作系统可以在一个进程出问题时，不影响其他进程的情况下，中止此进程的运行，并将相关环境保存下来，这就是core dump文件，可供分析。

如果进程是用高级语言编写并编译的，且用户有源程序，那么可以通过在编译时带上诊断用符号表（所有高级语言编译程序都有这种功能），通过系统提供的分析工具，加上core文件，能够分析到哪一个源程序语句造成的问题，进而比较容易地修正问题，当然，要做到这样，除非一开始就带上了符号表进行编译，否则只能重新编译程序，并重新运行程序，重现错误，才能显示出源程序出错位置。

如果用户没有源程序，那么只能分析到汇编指令的级别，难于查找问题所在并作出修正，所以这种情况下就不必多费心了，找到出问题的地方也没有办法。

进程Core Dump的时候，操作系统会将进程异常终止掉并释放其占用的资源，不可能对系统本身的运行造成危害。这是与系统DUMP根本区别的一点，系统DUMP产生时，一定伴随着系统崩溃和停机，进程Core Dump时，只会造成相应的进程被终止，系统本身不可能崩溃。当然如果此进程与其他进程有关联，其他进程也会受到影响，至于后果是什么，就看相关进程对这种异常情况（与自己相关的进程突然终止）的处理机制是什么了，没有一概的定论。

如何生成coredump文件?

登陆LINUX服务器，任意位置键入
echo "ulimit -c 1024" >> /etc/profile
退出LINUX重新登陆LINUX
键入 ulimit -c
如果显示 1024 那么说明coredump已经被开启。

//---------------------------------------------------------------
1. core文件的简单介绍
//---------------------------------------------------------------

在一个程序崩溃时，它一般会在指定目录下生成一个core文件。core文件仅仅是一个内存映象(同时加上调试信息)，主要是用来调试的。

//---------------------------------------------------------------
2. 开启或关闭core文件的生成
//---------------------------------------------------------------

用以下命令来阻止系统生成core文件:
ulimit -c 0
下面的命令可以检查生成core文件的选项是否打开:
ulimit -a
该命令将显示所有的用户定制，其中选项-a代表“all”。

也可以修改系统文件来调整core选项
在/etc/profile通常会有这样一句话来禁止产生core文件，通常这种设置是合理的:
# No core files by default
ulimit -S -c 0 > /dev/null 2>&1
但是在开发过程中有时为了调试问题，还是需要在特定的用户环境下打开core文件产生的设置
在用户的~/.bash_profile里加上ulimit -c unlimited来让特定的用户可以产生core文件
如果ulimit -c 0 则也是禁止产生core文件，而ulimit -c 1024则限制产生的core文件的大小不能超过1024kb

//---------------------------------------------------------------
3. 设置Core Dump的核心转储文件目录和命名规则
//---------------------------------------------------------------

/proc/sys/kernel/core_uses_pid可以控制产生的core文件的文件名中是否添加pid作为扩展，如果添加则文件内容为1，否则为0
proc/sys/kernel/core_pattern可以设置格式化的core文件保存位置或文件名，比如原来文件内容是core-%e
可以这样修改:
echo "/corefile/core-%e-%p-%t" > core_pattern
将会控制所产生的core文件会存放到/corefile目录下，产生的文件名为core-命令名-pid-时间戳
以下是参数列表:
    %p - insert pid into filename 添加pid
    %u - insert current uid into filename 添加当前uid
    %g - insert current gid into filename 添加当前gid
    %s - insert signal that caused the coredump into the filename 添加导致产生core的信号
    %t - insert UNIX time that the coredump occurred into filename 添加core文件生成时的unix时间
    %h - insert hostname where the coredump happened into filename 添加主机名
    %e - insert coredumping executable name into filename 添加命令名

//---------------------------------------------------------------
4. 使用core文件
//---------------------------------------------------------------

在core文件所在目录下键入:
gdb -c core
它会启动GNU的调试器，来调试core文件，并且会显示生成此core文件的程序名，中止此程序的信号等等
如果你已经知道是由什么程序生成此core文件的，比如MyServer崩溃了生成core.12345，那么用此指令调试:
gdb -c core MyServer
以下怎么办就该去学习gdb的使用了

//---------------------------------------------------------------
5. 一个小方法来测试产生core文件
//---------------------------------------------------------------

直接输入指令:
kill -s SIGSEGV $$

Jan6

nginx中有关进程的概念

Author: leeon Click: 9439 Comments: 0 Category: 操作系统 Tag: 进程,nginx

Nginx是采用master进程 + 多个worker进程 +多路复用I/O事件处理器的架构

Master进程：
 创建监听socket
 创建worker子进程，之后的主要动作就是监控子进程的工作状态

Worker进程的主循环：
 更新当前时间
 查看当前监听的事件是否被触发，如有调用相应的处理函数进行处理
 处理超时连接

master负责创建监听套接字，同时也是worker的父进程
master进程直接控制worker进程 worker进程不受客户干预
master进程监控worker子进程之外，还处理客户的控制指令，统一由它分发给worker子进程

worker进程的负载均衡问题：
由于各个worker进程之间相互独立，由内核协议栈统一将接收的新连接分发给各个worker子进程进行处理，很可能出现有些子进程处理的连接多，有些处理的少----即负载不均衡
Nginx中，子进程每次接收一个新连接，会根据当前该进程的连接数量，更新一个阙值，由这个阙值决定是否该暂缓接收的连接这样，各个子进程之间有一个相对的均衡Nginx中还对accept操作做了加锁，任意时刻只可能有一个子进程可以接收新的连接，避免惊群现象的出现。

分享未来 ^Internet _Technology

【原创】ESXI 6.7自动关机设置

【转载】System Dump与Core Dump的区别

如何生成coredump文件?

nginx中有关进程的概念

分类

标签

归档

最新评论

我看过的书

链接

其他

分享未来 Internet Technology

【原创】ESXI 6.7自动关机设置

【转载】System Dump与Core Dump的区别

如何生成coredump文件?

nginx中有关进程的概念

分类

标签

归档

最新评论

我看过的书

链接

其他

分享未来 ^Internet _Technology