黑群晖失联卡死问题分析小记

缘起夏天到了,最近蜗牛星际搞的黑群频繁的卡死失联,短则开机十来分钟就卡死,长则半天一天的。表现就是机器完全卡死,ping不通,机器只能强制按电源关机后再开。这次记录下分析的过程,做一个小记。分析过程既然是运行中死机,那查下网上死机的分析,看了很多基本没有明确的思路。那既然没有思路,就使用电脑硬件常见的排除法了,开始是怀疑移动硬盘存在稳定性问题导致整体卡死了,因为之前遇到过挂了一个移动硬盘,导致硬盘io巨慢,系统卡顿。把移动硬盘去除后,发现问题依旧,那么是不是内置的硬盘坏了呢?从系统smart信息

阅读全部

硬盘扇区解疑

缘起最近使用希捷硬盘盒装的3T硬盘满了,准备搞一个8T的硬盘换上去,就涉及到把老的3T硬盘克隆过去,遇到了扇区不对应的问题,这里解惑记录下。折腾过程问题情况由于要克隆硬盘,就把希捷硬盘盒里的3T硬盘和新的8T硬盘都插到一个多盘位的硬盘盒上,然后使用winhex顺利的拷贝完成。接下来问题来了,把克隆完成的8T硬盘插到希捷硬盘盒上,发现硬盘在nas上没办法使用了,能看到分区,但是只要格式化或者拓展分区到8T(因为是克隆的3T分区,显示分区大小还是3T)就会操作失败或者卡死。同时呢,表现非常像是只读保

阅读全部

linux网卡名称释疑

缘起之前家里服务器和各个虚拟机上的网卡名称各异,有叫ens1的,也有比较长叫enp1s0的,比较奇怪但是没有研究是为什么这次空了就研究了一下,记录释疑原因早期linux网卡名称是没有这么大变化的,都是eth0,eth1啥的最近这些年linux发行版大量采用systemd系统,而systemd的网卡命名是不同的,也就是上面的ens1啥的那么这些s1、p1代表什么呢?/*  * Two character prefixes based on

阅读全部

ubuntu移除snap软件包系统

缘起最近在分析家里的服务器的内存情况,宿主和虚拟机的内存都吃紧,而近期升级ubuntu24.04,明显发现内存要求高了,在20.04和22.04系统上,400MB内存可以正常跑起来,24.04上,至少要600MB,不然系统启动后就挂掉了。。。而查了下,ubuntu新的系统上,增加了很多的额外的商业的东西,比如snap软件包管理系统,这个没啥用,还默认启用安装了,包括server版本,因此这篇文档记录怎么移除。另外,最新的24.04的桌面版上,使用apt安装的Firefox和thunderbird

阅读全部

设置systemd的journal日志磁盘占用

缘起最近在看家里的服务器和里边的虚拟机的运行情况,发现/var/log/journal/占用了大量的磁盘空间,多的能达到2-3G。比较好奇是什么样的日志这么占用空间,传统的syslog或者message一般会gzip压缩轮转,不会这么大,因此有了这次的折腾分析,在此记录下。折腾过程首先看了下这个journal日志是什么,搜索后发现这个是systemd系统的日志系统。内部包含了从启动到后续运行的各种的系统日志,包括系统级的日志,比如kernel日志、dmesg日志,也包含user级别的日志,比如c

阅读全部

win10关闭快速启动

缘起最近偶然发现windows10系统的电脑,开机后显示的开机时间不对,像是没有重置过,有几十天的时间。而最近开机好像也看不到主板的开机画面了,直接黑屏很久后进入系统。因此就搜索了一下,发现是windwos的快速启动导致的。网上也讲到这个开了之后,一直黑屏,也影响进入bios。。关闭快速启动依次打开控制面板,选择硬件和声音,电源选项,选择左侧边栏的电源按钮选项,进入后关闭休眠、快速启动这几个选项,保存后重启即可关机后在开机能正常看到bios开机画面了。总结windwos的台式机也开启这个,属实是

阅读全部

scp Connection closed问题分析

缘起之前一直可以运行的scp文件拉取脚本不行了,报connect错误:scp: Connection closed而服务端并没有做什么限制,其他的客户端拉取是可以的,因此就简单分析了下原因,作为备忘。折腾过程是否是防火墙类原因首先怀疑是客户端和服务端的防火墙限制,导致连接中断。从服务端日志看到客户端断开的日志:Received disconnect from xxxx port xx:11: disconnected

阅读全部

docker配置代理

缘起从去年年底应该是docker访问存在问题,拉取新的镜像会失败,网络上很多的增加http_proxy类的方法存在误导,因此记录此文章备忘。一句话,docker的镜像拉取是在dockerd服务中的,因此要设置服务的代理才能生效,直接docker命令设置代理无效。操作错误方式增加export HTTPS_PROXY=http://192.168.x.x:xxx然后进行docker pull操作网上不少文章这么讲的,一些大模型的结果也是这方法,不会生效,原因如下。一句话,docker的镜像拉取是在d

阅读全部

j3455卡死问题分析解决

缘起年前稳定运行了很长时间的j3455处理器系统挂了,反复分析折腾了很久才查到具体的原因,以及j3455处理器的显示系统故障问题,因此记录详细的过程,方便回顾以及类似问题的参考。折腾过程稳定运行很长时间的系统突然挂了1月12日早上7点28突然挂了,电源常亮,宿主和各个虚拟机都ping不通,长按关机都不行。后接入显示器,尝试断电后重新进入,发现bios被重置,重新设置bios后插入usb键盘设置后开机,上午10点多开机,12点多回来发现还是卡死了。看显示器显示:kvm [1180]:&n

阅读全部

ubuntu24.04安装python2.7

缘起最近由于老的ubuntu系统快结束维护了,就在2月底更新系统到最新的24.04了,结果新的系统python2被完全废弃了,因此需要自行编译。折腾过程编译的文章比较多,主要的步骤如下:# 安装依赖 sudo apt install build-essential zlib1g-dev libssl-dev libbz2-dev libffi-dev libncurses5-dev # 下载py

阅读全部