Без головы sh каждые 1-7 дней - proUbuntu
0 голосов
/ 04 мая

У меня безголовая Ubuntu подача r, которая надежно падает каждые 1-7 дней. Он рухнул 5/1, а затем снова 5/3 около 8:30 по местному времени. Я отсканировал логи для информации r, но ничего не ожидается. Вот соответствующий фрагмент / var / log / syslog:

May  3 07:12:13 marvin snapd[879]: autorefresh.go:397: auto-refresh: all snaps are up-to-date
May  3 07:17:01 marvin CRON[23226]: (root) CMD (   cd / && run-parts --report /etc/cron.hourly)
May  3 07:30:01 marvin CRON[28582]: (root) CMD ([ -x /etc/init.d/anacron ] && if [ ! -d /run/systemd/system ]; then /usr/sbin/invoke-rc.d anacron start >/dev/null; fi)
May  3 08:04:23 marvin systemd[1]: Started Run anacron jobs.
May  3 08:04:23 marvin anacron[10633]: Anacron 2.3 started on 2020-05-03
May  3 08:04:23 marvin anacron[10633]: Normal exit (0 jobs run)
May  3 08:17:01 marvin CRON[15912]: (root) CMD (   cd / && run-parts --report /etc/cron.hourly)
May  3 14:23:35 marvin systemd-modules-load[290]: Inserted module 'lp'
May  3 14:23:35 marvin systemd-modules-load[290]: Inserted module 'ppdev'
May  3 14:23:35 marvin systemd-modules-load[290]: Inserted module 'parport_pc'
May  3 14:23:35 marvin systemd[1]: Started Uncomplicated firewall.
May  3 14:23:35 marvin systemd[1]: Started Load Kernel Modules.

Строки журнала в 14:23 - это когда я вернулся домой и смог перезапустить подачу r. Когда он «разбился», индикатор питания r все еще горит, но он не реагирует на эхо-запросы, а при подключении монитора r на экране ничего не отображается.

Служба r просто используется в качестве мультимедийной системы Plex r, потоковой передачи видео с NAS, которое смонтировано с NFS. Plex работает в Docker контейнере r, и у меня есть несколько других r маленьких контейнеров, работающих как OpenVPN. Я бегу Ubuntu 18.04.4. Я не знаю, полезно ли это, но вот дамп моего аппаратного обеспечения:

max@marvin:~$ sudo lshw -short
H/W path      Device           Class          Description
=========================================================
                               system         To Be Filled By O.E.M. (To Be Filled By O.E.M.)
/0                             bus            H110M-STX
/0/0                           memory         64KiB BIOS
/0/8                           memory         128KiB L1 cache
/0/9                           memory         128KiB L1 cache
/0/a                           memory         1MiB L2 cache
/0/b                           memory         8MiB L3 cache
/0/c                           processor      Intel(R) Core(TM) i7-6700K CPU @ 4.00GHz
/0/d                           memory         16GiB System Memory
/0/d/0                         memory         8GiB SODIMM DDR4 Synchronous 2133 MHz (0.5 ns)
/0/d/1                         memory         8GiB SODIMM DDR4 Synchronous 2133 MHz (0.5 ns)
/0/100                         bridge         Xeon E3-1200 v5/E3-1500 v5/6th Gen Core Processor Host Bridge/DRAM Registers
/0/100/1                       bridge         Xeon E3-1200 v5/E3-1500 v5/6th Gen Core Processor PCIe Controller (x16)
/0/100/1/0                     storage        NVMe SSD Controller SM961/PM961
/0/100/2                       display        HD Graphics 530
/0/100/14                      bus            100 Series/C230 Series Chipset Family USB 3.0 xHCI Controller
/0/100/14/0   usb1             bus            xHCI Host Controller
/0/100/14/1   usb2             bus            xHCI Host Controller
/0/100/14.2                    generic        100 Series/C230 Series Chipset Family Thermal Subsystem
/0/100/16                      communication  100 Series/C230 Series Chipset Family MEI Controller #1
/0/100/17                      storage        Q170/Q150/B150/H170/H110/Z170/CM236 Chipset SATA Controller [AHCI Mode]
/0/100/1c                      bridge         100 Series/C230 Series Chipset Family PCI Express Root Port #5
/0/100/1f                      bridge         H110 Chipset LPC/eSPI Controller
/0/100/1f.2                    memory         Memory controller
/0/100/1f.3                    multimedia     100 Series/C230 Series Chipset Family HD Audio Controller
/0/100/1f.4                    bus            100 Series/C230 Series Chipset Family SMBus
/0/100/1f.6   enp0s31f6        network        Ethernet Connection (2) I219-V
/0/1          scsi1            storage
/0/1/0.0.0    /dev/sda         disk           500GB Samsung SSD 860
/0/1/0.0.0/1  /dev/sda1        volume         465GiB EXT4 volume

Я немного сошел с ума, пытаясь выяснить это, поэтому любая помощь будет высоко ценится.

РЕДАКТИРОВАТЬ 1: Добавление вывода ls -la /var/crash. Там ничего нет.

max@marvin:~$ ls -la /var/crash
total 8
drwxrwsrwt  2 root whoopsie 4096 Oct 14  2019 .
drwxr-xr-x 15 root root     4096 May  3  2018 ..

РЕДАКТИРОВАТЬ 2: Дополнительная информация. Я заметил, что иногда sensors сообщает об очень разных значениях с интервалом всего в несколько секунд. Два нижеприведенных выхода были запущены вплотную.

max@marvin:~$ sudo dmidecode -s bios-version
P1.10

max@marvin:~$ sensors
pch_skylake-virtual-0
Adapter: Virtual device
temp1:        +53.5°C

coretemp-isa-0000
Adapter: ISA adapter
Package id 0:  +58.0°C  (high = +80.0°C, crit = +100.0°C)
Core 0:        +44.0°C  (high = +80.0°C, crit = +100.0°C)
Core 1:        +47.0°C  (high = +80.0°C, crit = +100.0°C)
Core 2:        +58.0°C  (high = +80.0°C, crit = +100.0°C)
Core 3:        +43.0°C  (high = +80.0°C, crit = +100.0°C)

max@marvin:~$ sensors
pch_skylake-virtual-0
Adapter: Virtual device
temp1:        +53.5°C

coretemp-isa-0000
Adapter: ISA adapter
Package id 0:  +44.0°C  (high = +80.0°C, crit = +100.0°C)
Core 0:        +40.0°C  (high = +80.0°C, crit = +100.0°C)
Core 1:        +42.0°C  (high = +80.0°C, crit = +100.0°C)
Core 2:        +38.0°C  (high = +80.0°C, crit = +100.0°C)
Core 3:        +39.0°C  (high = +80.0°C, crit = +100.0°C)

Вычислительный r представляет собой ASRock DeskMini 110 с памятью SODIMM 167 ГБ DDR4 2400 МГц i7-6700K, от Corsai r, Noctua NH-L9I (отлично крутится), накопитель Samsung 960 EVO NVME емкостью 250 ГБ и твердотельный накопитель Samsung SATA емкостью 500 ГБ (думаю, 860 EVO, не могу вспомнить).

Вот захват вывод от top. Если вы хотите r реальный скриншот, дайте мне знать.

top - 10:58:47 up 20:35,  2 users,  load average: 0.61, 0.37, 0.33
Tasks: 345 total,   1 running, 270 sleeping,   0 stopped,   0 zombie
%Cpu(s):  2.2 us,  0.8 sy,  0.0 ni, 96.9 id,  0.0 wa,  0.0 hi,  0.0 si,  0.0 st
KiB Mem : 16120772 total,   942036 free,  4121516 used, 11057220 buff/cache
KiB Swap:  2097148 total,   371812 free,  1725336 used. 11667140 avail Mem

  PID USER      PR  NI    VIRT    RES    SHR S  %CPU %MEM     TIME+ COMMAND
 7137 max       20   0 2872064 747632   3372 S  11.2  4.6 109:14.82 java
15027 root      20   0    4504    772    704 S   4.9  0.0   0:00.15 sh
 8826 911       20   0  508872  43296   4804 S   2.0  0.3  15:14.61 deluged
 6401 max       20   0 4612692 998252  18232 S   1.0  6.2  24:04.40 Plex Media Serv
 1184 root      20   0 3327792  26348  15320 S   0.7  0.2   6:23.03 containerd
 1321 root      20   0 4151696  49524  12680 S   0.7  0.3   6:49.66 dockerd
 6438 max       35  15 1862372 204256   5680 S   0.7  1.3   2:39.45 Plex Script Hos
 9831 911       20   0  147104 101632   6036 S   0.7  0.6  59:57.74 python3
22107 max       20   0   77320   6224   5324 S   0.7  0.0   3:07.15 systemd
    1 root      20   0  226000   8380   6008 S   0.3  0.1   4:22.96 systemd
  847 root      20   0   70704   5840   5020 S   0.3  0.0   0:52.57 systemd-logind
  873 message+  20   0   50848   4732   3336 S   0.3  0.0   2:54.19 dbus-daemon
 4441 root      20   0   11828   3384   2348 S   0.3  0.0   0:58.45 containerd-shim
 6894 911       20   0  603768  18392   4824 S   0.3  0.1   4:25.21 deluged
 8202 911       20   0  168528 102360   3364 S   0.3  0.6   4:43.52 python
10469 911       20   0 4918084 305300   6312 S   0.3  1.9 182:10.26 sabnzbdplus
    2 root      20   0       0      0      0 S   0.0  0.0   0:00.07 kthreadd
    4 root       0 -20       0      0      0 I   0.0  0.0   0:00.00 kworker/0:0H
    6 root       0 -20       0      0      0 I   0.0  0.0   0:00.00 mm_percpu_wq
    7 root      20   0       0      0      0 S   0.0  0.0   0:01.52 ksoftirqd/0
    8 root      20   0       0      0      0 I   0.0  0.0   0:39.70 rcu_sched
    9 root      20   0       0      0      0 I   0.0  0.0   0:00.00 rcu_bh
   10 root      rt   0       0      0      0 S   0.0  0.0   0:00.11 migration/0
   11 root      rt   0       0      0      0 S   0.0  0.0   0:00.11 watchdog/0
   12 root      20   0       0      0      0 S   0.0  0.0   0:00.00 cpuhp/0
   13 root      20   0       0      0      0 S   0.0  0.0   0:00.00 cpuhp/1
   14 root      rt   0       0      0      0 S   0.0  0.0   0:00.10 watchdog/1
   15 root      rt   0       0      0      0 S   0.0  0.0   0:00.14 migration/1
   16 root      20   0       0      0      0 S   0.0  0.0   0:01.34 ksoftirqd/1
   18 root       0 -20       0      0      0 I   0.0  0.0   0:00.00 kworker/1:0H
   19 root      20   0       0      0      0 S   0.0  0.0   0:00.00 cpuhp/2
   20 root      rt   0       0      0      0 S   0.0  0.0   0:00.12 watchdog/2
   21 root      rt   0       0      0      0 S   0.0  0.0   0:00.12 migration/2
   22 root      20   0       0      0      0 S   0.0  0.0   1:47.23 ksoftirqd/2
   24 root       0 -20       0      0      0 I   0.0  0.0   0:00.00 kworker/2:0H
   25 root      20   0       0      0      0 S   0.0  0.0   0:00.00 cpuhp/3
   26 root      rt   0       0      0      0 S   0.0  0.0   0:00.12 watchdog/3
   27 root      rt   0       0      0      0 S   0.0  0.0   0:00.14 migration/3
   28 root      20   0       0      0      0 S   0.0  0.0   0:01.39 ksoftirqd/3
   30 root       0 -20       0      0      0 I   0.0  0.0   0:00.00 kworker/3:0H
   31 root      20   0       0      0      0 S   0.0  0.0   0:00.00 cpuhp/4
   32 root      rt   0       0      0      0 S   0.0  0.0   0:00.11 watchdog/4
   33 root      rt   0       0      0      0 S   0.0  0.0   0:00.15 migration/4
   34 root      20   0       0      0      0 S   0.0  0.0   0:01.28 ksoftirqd/4
   36 root       0 -20       0      0      0 I   0.0  0.0   0:00.00 kworker/4:0H
   37 root      20   0       0      0      0 S   0.0  0.0   0:00.00 cpuhp/5
   38 root      rt   0       0      0      0 S   0.0  0.0   0:00.11 watchdog/5
   39 root      rt   0       0      0      0 S   0.0  0.0   0:00.14 migration/5
   40 root      20   0       0      0      0 S   0.0  0.0   0:01.19 ksoftirqd/5
   42 root       0 -20       0      0      0 I   0.0  0.0   0:00.00 kworker/5:0H
   43 root      20   0       0      0      0 S   0.0  0.0   0:00.00 cpuhp/6
   44 root      rt   0       0      0      0 S   0.0  0.0   0:00.12 watchdog/6
   45 root      rt   0       0      0      0 S   0.0  0.0   0:00.11 migration/6
   46 root      20   0       0      0      0 S   0.0  0.0   0:01.89 ksoftirqd/6
   48 root       0 -20       0      0      0 I   0.0  0.0   0:00.00 kworker/6:0H
   49 root      20   0       0      0      0 S   0.0  0.0   0:00.00 cpuhp/7
   50 root      rt   0       0      0      0 S   0.0  0.0   0:00.12 watchdog/7
   51 root      rt   0       0      0      0 S   0.0  0.0   0:00.14 migration/7
   52 root      20   0       0      0      0 S   0.0  0.0   0:01.23 ksoftirqd/7
   54 root       0 -20       0      0      0 I   0.0  0.0   0:00.00 kworker/7:0H
   55 root      20   0       0      0      0 S   0.0  0.0   0:00.00 kdevtmpfs
   56 root       0 -20       0      0      0 I   0.0  0.0   0:00.00 netns
   57 root      20   0       0      0      0 S   0.0  0.0   0:00.00 rcu_tasks_kthre

Процесс java вверху - это сервер minecraft; машина зависла независимо от этого работает.

Заранее спасибо!

1 Ответ

1 голос
/ 04 мая

B IOS

Примечание : иметь хорошие резервные копии перед выполнением обновления B IOS

У вас B IOS P1.10. Если я правильно читаю сайт ASRock, версия 8.10 является актуальной. Пожалуйста, отметьте здесь . Убедитесь, что это правильное местоположение для r обновления B IOS для r вас r точной модели #.

Обмен

KiB Swap:  2097148 total,   371812 free,  1725336 used.

У вас r использование свопа велико, и только с 2G / swapfile нам, вероятно, нужно увеличить его. Существует также небольшая вероятность того, что одно из вас r приложений использует такой высокий своп.

Если grep -i swap /etc/fstab показывает это ...

/swapfile    none    swap    sw      0   0

, тогда вы используете / файл подкачки вместо раздела подкачки.

Давайте увеличим его с 2G до 4G ...

Примечание : неправильное использование команды dd может привести к потере данных , Предложите скопировать / вставить.

sudo swapoff -a           # turn off swap
sudo rm -i /swapfile      # remove old /swapfile

sudo dd if=/dev/zero of=/swapfile bs=1M count=4096

sudo chmod 600 /swapfile  # set proper file protections
sudo mkswap /swapfile     # init /swapfile
sudo swapon /swapfile     # turn on swap
free -h                   # confirm 16G RAM and 4G swap
reboot                    # reboot and verify operation

Samsung SSD

Если у вас есть Windows, go to здесь , и загрузите их r Samsung Magician и проверьте прошивку на r SSD.

...