2019-04-07

latex

数学符号的输入

插入矩阵

插入图片

插入单张图片

\begin{figure}[h]%%图
    \centering  %插入的图片居中表示
    \includegraphics[width=0.7\linewidth]{figures/mcmthesis-logo}  %插入的图，包括JPG,PNG,PDF,EPS等，放在源文件目录下
    \caption{this is a figure.}  %图片的名称
    \label{fig:mcmthesis-logo}   %标签，用作引用
\end{figure}

多张图片并排

\begin{figure}[h]%%图
    \begin{minipage}[t]{0.4\linewidth}%并排放两张图片，每张占行的0.4
        \centering
        \includegraphics[width=1.2\textwidth]{a.png}
        \caption{母图}
    \end{minipage}
    \hfill
    \begin{minipage}[t]{0.4\linewidth}
        \centering  %插入的图片居中表示
        \includegraphics[width=1.2\textwidth]{b.png}  %插入的图，包括JPG,PNG,PDF,EPS等，放在源文件目录下
        \caption{子图}  %图片的名称
        \label{fig:mcmthesis-logo}   %标签，用作引用
    \end{minipage}
\end{figure}

\begin{figure}[htbp]
    \centering
    \subfigure[]{
        \begin{minipage}[t]{0.4\linewidth}
        \centering
        \includegraphics[width=0.8\linewidth]{28_a.png}
        \end{minipage}
    }
    \subfigure[pic2.]{
        \begin{minipage}[t]{0.4\linewidth}
        \centering
        \includegraphics[width=0.8\linewidth]{28_b.png}
        \end{minipage}
    }
    \centering
    \caption{}
\end{figure}

equation公式跨页

改用

1 2	\begin{align} \end{align}

顶部增加 \allowdisplaybreaks[4]

https://www.geogebra.org/graphing

2019-04-05

leetcode-665

665. Non-decreasing Array

2019-03-31

android-event-handle

Android事件处理

2019-03-24

logistic-regression

Logisitic regression

2019-03-18

computer-vision

工作流程	输入	输出
图像分类	原始图像	每个索引对应每一类的概率
物体检测	原始图像	物体的位置
图像分割	原始图像	分割的每一类图像的叠加，其中各个值表示相应像素属于每一类的概率

Harris Corner detector

Corner significant change in all directions

2019-03-09

android-backgroundtask

2019-03-08

cuda

nvidia-smi 显示GPU信息

void CPUFunction()
{
  printf("This function is defined to run on the CPU.\n");
}

__global__ void GPUFunction() //__global__的返回值为void
{
  printf("This function is defined to run on the GPU.\n");
}

int main()
{
  CPUFunction();

  GPUFunction<<<2, 4>>>(); // 2 blocks, 4 threads / block
  cudaDeviceSynchronize();
}

核函数启动方式为异步

1	<<< NUMBER_OF_BLOCKS, NUMBER_OF_THREADS_PER_BLOCK>>>

gridDim.x grid中的block数量
blockIdx.x grid中当前block的index（从0开始）
blockDim.x block中线程数量
threadIdx.x block中线程的index（从0开始）

32个线程一个wrap

鉴于 GPU 的硬件特性，所含线程的数量为 32 的倍数的线程块是为理想的选择

动态计算block的数量，N为问题规模

1	size_t number_of_blocks = (N + threads_per_block - 1) / threads_per_block;

grid中的线程数小于问题规模N的情况

在核函数中加入网格跨度循环, 一个线程完成index, index + threads_per_grid, index + threads_per_grid*2 …的任务

__global void kernel(int *a, int N)
{
  int indexWithinTheGrid = threadIdx.x + blockIdx.x * blockDim.x;
  int gridStride = gridDim.x * blockDim.x;

  for (int i = indexWithinTheGrid; i < N; i += gridStride)
  {
    // do work on a[i];
  }
}

错误处理

cudaError_t err;
err = cudaMallocManaged(&a, N)                    // Assume the existence of `a` and `N`.

if (err != cudaSuccess)                           // `cudaSuccess` is provided by CUDA.
{
  printf("Error: %s\n", cudaGetErrorString(err)); // `cudaGetErrorString` is provided by CUDA.
}

someKernel<<<1, -1>>>();  // -1 is not a valid number of threads.

cudaError_t err;
err = cudaGetLastError(); // `cudaGetLastError` will return the error from above.
if (err != cudaSuccess)
{
  printf("Error: %s\n", cudaGetErrorString(err));
}

封装成宏

inline cudaError_t checkCuda(cudaError_t result)
{
  if (result != cudaSuccess) {
    fprintf(stderr, "CUDA Runtime Error: %s\n", cudaGetErrorString(result));
    assert(result == cudaSuccess);
  }
  return result;
}

流

核函数在流中运行，
cuda中有一个默认流和多个非默认流
流中的核函数顺序执行，
不同的非默认流中的核函数可以同时运行（无法保证顺序）
默认流中的核函数不能与其他非默认流的核函数同时运行
默认流会受到阻碍，并在其他所有流完成之后方可运行，但其亦会阻碍其他流的运行直至其自身已运行完毕

cudaStream_t stream;
cudaStreamCreate(&stream);

kernel<<<number_of_blocks, threads_per_block, bytes_of_shared_memory, stream>>>;

// some things to do

cudaStreamDestroy(stream);